clinc_oos

  • Açıklama :

Göreve yönelik iletişim sistemlerinin, bir sorgunun desteklenen amaç aralığının dışına çıktığını bilmesi gerekir, ancak mevcut metin sınıflandırma dercesi yalnızca her örneği kapsayan etiket kümelerini tanımlar. Kapsam dışı (OOS) sorguları, yani sistemin desteklenen amaçlarından herhangi birine girmeyen sorguları içeren yeni bir veri kümesi sunuyoruz. Modeller, çıkarım zamanındaki her sorgunun sistem tarafından desteklenen bir amaç sınıfına ait olduğunu varsayamayacağından, bu durum yeni bir zorluk teşkil eder. Veri setimiz ayrıca 10 alan üzerinde 150 niyet sınıfını kapsar ve üretim görevi odaklı bir aracının işlemesi gereken genişliği yakalar. Görev odaklı diyalog sistemlerinde metin sınıflandırmasını daha titiz ve gerçekçi bir şekilde kıyaslamanın bir yolunu sunar.

Bölmek örnekler
'test' 4.500
'test_oos' 1.000
'train' 15.000
'train_oos' 100
'validation' 3.000
'validation_oos' 100
  • Özellik yapısı :
FeaturesDict({
    'domain': int32,
    'domain_name': Text(shape=(), dtype=string),
    'intent': int32,
    'intent_name': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
alan adı tensör int32
alan adı Metin sicim
niyet tensör int32
niyet_adı Metin sicim
Metin Metin sicim
  • Alıntı :
@inproceedings{larson-etal-2019-evaluation,
    title = "An Evaluation Dataset for Intent Classification and Out-of-Scope Prediction",
    author = "Larson, Stefan  and
      Mahendran, Anish  and
      Peper, Joseph J.  and
      Clarke, Christopher  and
      Lee, Andrew  and
      Hill, Parker  and
      Kummerfeld, Jonathan K.  and
      Leach, Kevin  and
      Laurenzano, Michael A.  and
      Tang, Lingjia  and
      Mars, Jason",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/D19-1131",
    doi = "10.18653/v1/D19-1131",
    pages = "1311--1316",
}