インドンリ

参考文献:

インドンリ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:indonli/indonli')
  • 説明
IndoNLI is the first human-elicited Natural Language Inference (NLI) dataset for Indonesian.
  IndoNLI is annotated by both crowd workers and experts. The expert-annotated data is used exclusively as a test set.
  It is designed to provide a challenging test-bed for Indonesian NLI by explicitly incorporating various linguistic phenomena such as numerical reasoning, structural changes, idioms, or temporal and spatial reasoning.
  • ライセンス: CC BY-SA 4.0

    帰属 — 適切なクレジットを付与し、ライセンスへのリンクを提供し、変更が加えられたかどうかを示す必要があります。これは、いかなる合理的な方法でも行うことができますが、ライセンサーがあなたまたはその使用を承認していることを示唆するような方法で行うことはできません。

    ShareAlike — 素材をリミックス、変換、または構築する場合は、オリジナルと同じライセンスに基づいて投稿を配布する必要があります。

    追加の制限なし — ライセンスで許可されている行為を他人が行うことを法的に制限する法的条件や技術的措置を適用することはできません。

  • バージョン: 1.1.0

  • 分割:

スプリット
'test_expert' 2984
'test_lay' 2201
'train' 10330
'validation' 2197
  • 特徴
{
    "premise": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "hypothesis": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 3,
        "names": [
            "entailment",
            "neutral",
            "contradiction"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}