エクストリーム
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
エクストリームベンチマーク
Cross-lingual TRansfer Evaluation of Multilingual Encoders (XTREME) ベンチマークは、事前トレーニング済みの多言語モデルのクロスリンガル一般化能力を評価するためのベンチマークです。類型的に多様な 40 の言語 (12 の言語ファミリにまたがる) をカバーし、さまざまなレベルの構文とセマンティクスについてまとめて推論する必要がある 9 つのタスクが含まれています。 XTREME の言語は、言語の多様性、既存のタスクの範囲、およびトレーニング データの可用性を最大化するように選択されています。これらの中には、ドラヴィダ語のタミル語 (南インド、スリランカ、およびシンガポールで話されている)、テルグ語とマラヤーラム語 (主に南インドで話されている)、ニジェール・コンゴ語のスワヒリ語とヨルバ語など、研究されていない言語が数多くあります。アフリカで。
ベンチマークの完全な説明については、論文を参照してください。
https://sites.research.google/xtreme
バージョン:
デフォルト バージョンのデータセット:
引用:
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2022-10-07 UTC。
[null,null,["最終更新日 2022-10-07 UTC。"],[],[],null,["# xtreme\n\n\u003cbr /\u003e\n\n- **Description**:\n\nXtreme Benchmark\n================\n\nThe Cross-lingual TRansfer Evaluation of Multilingual Encoders (XTREME)\nbenchmark is a benchmark for the evaluation of the cross-lingual generalization\nability of pre-trained multilingual models. It covers 40 typologically diverse\nlanguages (spanning 12 language families) and includes nine tasks that\ncollectively require reasoning about different levels of syntax and semantics.\nThe languages in XTREME are selected to maximize language diversity, coverage in\nexisting tasks, and availability of training data. Among these are many\nunder-studied languages, such as the Dravidian languages Tamil (spoken in\nsouthern India, Sri Lanka, and Singapore), Telugu and Malayalam (spoken mainly\nin southern India), and the Niger-Congo languages Swahili and Yoruba, spoken in\nAfrica.\n\nFor a full description of the benchmark, see the\n[paper](https://arxiv.org/abs/2003.11080).\n\n- **Homepage**:\n\n\u003chttps://sites.research.google/xtreme\u003e\n\n- **Versions**:\n\n - **`1.0.0`** (default): Initial release\n- **Datasets in the default version**:\n\n - `xnli`: [`xtreme_xnli:1.1.0`](https://www.tensorflow.org/datasets/catalog/xtreme_xnli)\n - `pawsx`: [`xtreme_pawsx:1.0.0`](https://www.tensorflow.org/datasets/catalog/xtreme_pawsx)\n - `pos`: [`xtreme_pos:1.0.0`](https://www.tensorflow.org/datasets/catalog/xtreme_pos)\n - `ner`: [`wikiann:1.0.0`](https://www.tensorflow.org/datasets/catalog/wikiann)\n - `xquad`: [`xquad:3.0.0`](https://www.tensorflow.org/datasets/catalog/xquad)\n - `mlqa`: [`mlqa:1.0.0`](https://www.tensorflow.org/datasets/catalog/mlqa)\n - `tydiqa`: [`tydi_qa:3.0.0`](https://www.tensorflow.org/datasets/catalog/tydi_qa)\n - `bucc`: [`bucc:1.0.0`](https://www.tensorflow.org/datasets/catalog/bucc)\n - `tatoeba`: [`tatoeba:1.0.0`](https://www.tensorflow.org/datasets/catalog/tatoeba)\n- **Citation**:"]]