- 説明:
Universal Dependencies (UD) は、さまざまな人間の言語間で文法 (品詞、形態学的特徴、および構文の依存関係) の一貫した注釈を付けるためのフレームワークです。 UD は、70 以上の言語で 100 以上のツリーバンクを作成する 200 人以上の貢献者によるオープン コミュニティの取り組みです。 UD を初めて使用する場合は、まず概要の最初の部分を読んでから、注釈のガイドラインを参照してください。
ソース コード:
tfds.datasets.xtreme_pos.Builderバージョン:
-
1.0.0(デフォルト): 初期リリース。
-
ダウンロードサイズ:
338.76 MiB自動キャッシュ(ドキュメント): はい
機能構造:
FeaturesDict({
'tokens': Sequence(Text(shape=(), dtype=string)),
'upos': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=18)),
})
- 機能のドキュメント:
| 特徴 | クラス | 形 | Dtype | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| トークン | シーケンス(テキスト) | (なし、) | ストリング | |
| ウポス | シーケンス(クラスラベル) | (なし、) | int64 |
監視されたキー(
as_superviseddocを参照):None図( tfds.show_examples ): サポートされていません。
引用:
@article{nivre2018universal,
title={Universal Dependencies 2.2},
author={Nivre, Joakim and Abrams, Mitchell and Agi{'c}, {
{Z} }eljko
and Ahrenberg, Lars and Antonsen, Lene and Aranzabe, Maria Jesus and
Arutie, Gashaw and Asahara, Masayuki and Ateyah, Luma and Attia,
Mohammed and others},
year={2018}
}
xtreme_pos/xtreme_pos_af (デフォルト設定)
データセットサイズ:
445.94 KiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 194 |
'test' | 425 |
'train' | 1,315 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ar
データセットサイズ:
3.35 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 909 |
'test' | 1,680 |
'train' | 6,075 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_bg
データセットサイズ:
2.14 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 1,115 |
'test' | 1,116 |
'train' | 8,907 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_de
データセットのサイズ:
37.62 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 19,233 |
'test' | 22,458 |
'train' | 166,849 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_el
データセットのサイズ:
7.17 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 2,559 |
'test' | 2,809 |
'train' | 28,152 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_en
データセットのサイズ:
4.67 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 4,699 |
'test' | 6,165 |
'train' | 26,825 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_es
データセットサイズ:
8.26 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 3,054 |
'test' | 3,147 |
'train' | 28,492 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_et
データセットのサイズ:
4.84 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 3,125 |
'test' | 3,760 |
'train' | 25,749 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_eu
データセットサイズ:
1.27 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 1,798 |
'test' | 1,799 |
'train' | 5,396 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_fa
データセットサイズ:
1.73 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 599 |
'test' | 600 |
'train' | 4,798 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_fi
データセットのサイズ:
4.48 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 3,239 |
'test' | 4,422 |
'train' | 27,198 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_fr
データセットのサイズ:
7.28 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 5,979 |
'test' | 9,465 |
'train' | 47,308 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_he
データセットサイズ:
1.57 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 484 |
'test' | 491 |
'train' | 5,241 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_hi
データセットのサイズ:
5.78 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 1,884 |
'test' | 2,909 |
'train' | 14,752 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_hu
データセットサイズ:
438.07 KiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 441 |
'test' | 449 |
'train' | 910 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_id
データセットサイズ:
1.31 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 559 |
'test' | 1,557 |
'train' | 4,477 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_it
データセットのサイズ:
6.85 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 2,278 |
'test' | 3,518 |
'train' | 29,685 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ja
データセットのサイズ:
3.57 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 8,938 |
'test' | 10,253 |
'train' | 47,926 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_kk
データセットサイズ:
167.15 KiBスプリット:
| スプリット | 例 |
|---|---|
'test' | 1,047人 |
'train' | 31 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ko
データセットのサイズ:
5.82 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 3,016 |
'test' | 4,276 |
'train' | 27,410 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_mr
データセットサイズ:
56.14 KiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 46 |
'test' | 47 |
'train' | 373 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_nl
データセットのサイズ:
2.90 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 1,394 |
'test' | 1,471 |
'train' | 18,051 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_pt
データセットのサイズ:
4.65 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 1,770 |
'test' | 2,681 |
'train' | 17,992 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ru
データセットのサイズ:
20.25 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 9,960 |
'test' | 11,336 |
'train' | 67,435 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ta
データセットサイズ:
3.65 KiBスプリット:
| スプリット | 例 |
|---|---|
'test' | 55 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_te
データセットサイズ:
143.77 KiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 131 |
'test' | 146 |
'train' | 1,051 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_th
データセットサイズ:
377.24 KiBスプリット:
| スプリット | 例 |
|---|---|
'test' | 1,000 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_tl
データセットサイズ:
228.78 KiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 80 |
'test' | 120 |
'train' | 400 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_tr
データセットサイズ:
1.06 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 988 |
'test' | 4,785 |
'train' | 3,664 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_ur
データセットサイズ:
1.50 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 552 |
'test' | 535 |
'train' | 4,043 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_vi
データセットサイズ:
454.32 KiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 800 |
'test' | 800 |
'train' | 1,400 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_yo
データセットサイズ:
22.65 KiBスプリット:
| スプリット | 例 |
|---|---|
'test' | 100 |
- 例( tfds.as_dataframe ):
xtreme_pos/xtreme_pos_zh
データセットのサイズ:
3.29 MiBスプリット:
| スプリット | 例 |
|---|---|
'dev' | 3,038 |
'test' | 5,528 |
'train' | 18,998 |
- 例( tfds.as_dataframe ):