clinc_oos

  • 説明:

タスク指向の対話システムは、クエリがサポートされているインテントの範囲外にある場合を知る必要がありますが、現在のテキスト分類コーパスは、すべての例をカバーするラベル セットのみを定義しています。範囲外 (OOS) のクエリ、つまり、システムがサポートする意図のいずれにも該当しないクエリを含む新しいデータセットを導入します。モデルは、推論時のすべてのクエリがシステムでサポートされているインテント クラスに属していると想定できないため、これは新たな課題をもたらします。私たちのデータセットは、10 のドメインにわたる 150 のインテント クラスもカバーしており、実稼働タスク指向のエージェントが処理しなければならない幅を捉えています。タスク駆動型ダイアログ システムでテキスト分類をより厳密かつ現実的にベンチマークする方法を提供します。

スプリット
'test' 4,500
'test_oos' 1,000
'train' 15,000
'train_oos' 100
'validation' 3,000
'validation_oos' 100
  • 機能構造:
FeaturesDict({
    'domain': int32,
    'domain_name': Text(shape=(), dtype=string),
    'intent': int32,
    'intent_name': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ドメインテンソルint32
ドメイン名文章ストリング
意図テンソルint32
インテント名文章ストリング
文章文章ストリング
  • 引用
@inproceedings{larson-etal-2019-evaluation,
    title = "An Evaluation Dataset for Intent Classification and Out-of-Scope Prediction",
    author = "Larson, Stefan  and
      Mahendran, Anish  and
      Peper, Joseph J.  and
      Clarke, Christopher  and
      Lee, Andrew  and
      Hill, Parker  and
      Kummerfeld, Jonathan K.  and
      Leach, Kevin  and
      Laurenzano, Michael A.  and
      Tang, Lingjia  and
      Mars, Jason",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/D19-1131",
    doi = "10.18653/v1/D19-1131",
    pages = "1311--1316",
}