- توضیحات :
این داده ها از مجموعه Tatoeba مورخ شنبه 2018/11/17 استخراج شده است.
برای هر زبان، ما 1000 جمله انگلیسی و ترجمه آنها را در صورت وجود انتخاب کرده ایم. لطفاً این مقاله را برای توضیح زبانها، خانوادهها و اسکریپتها و همچنین نتایج پایه بررسی کنید.
لطفاً توجه داشته باشید که جملات انگلیسی برای همه جفتهای زبانی یکسان نیستند. این بدان معنی است که نتایج به طور مستقیم در بین زبان ها قابل مقایسه نیستند.
صفحه اصلی : http://opus.nlpl.eu/Tatoeba.php
کد منبع :
tfds.datasets.tatoeba.Builder
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
ذخیره خودکار ( اسناد ): بله
ساختار ویژگی :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
منبع_زبان | متن | رشته | ||
منبع_جمله | متن | رشته | ||
زبان مقصد | متن | رشته | ||
هدف_جمله | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af (پیکربندی پیش فرض)
حجم دانلود :
58.24 KiB
حجم مجموعه داده :
162.74 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ar
حجم دانلود :
70.95 KiB
حجم مجموعه داده :
175.46 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
حجم دانلود :
99.88 KiB
اندازه مجموعه داده :
204.64 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_bn
حجم دانلود :
89.55 KiB
حجم مجموعه داده :
194.24 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_de
حجم دانلود :
103.09 KiB
حجم مجموعه داده :
207.93 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_el
حجم دانلود :
77.11 KiB
حجم مجموعه داده :
181.65 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_es
حجم دانلود :
70.57 KiB
حجم مجموعه داده :
175.12 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_et
حجم دانلود :
58.33 KiB
حجم مجموعه داده :
162.85 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_eu
حجم دانلود :
64.52 KiB
اندازه مجموعه داده :
169.02 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_fa
حجم دانلود :
91.52 KiB
حجم مجموعه داده :
196.15 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_fi
حجم دانلود :
73.90 KiB
حجم مجموعه داده :
178.47 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_fr
حجم دانلود :
78.14 KiB
اندازه مجموعه داده :
182.68 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_he
حجم دانلود :
81.54 KiB
حجم مجموعه داده :
186.15 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_hi
حجم دانلود :
119.69 KiB
حجم مجموعه داده :
224.89 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_hu
حجم دانلود :
67.27 KiB
حجم مجموعه داده :
171.78 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_id
حجم دانلود :
73.09 KiB
حجم مجموعه داده :
177.61 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_it
حجم دانلود :
64.29 KiB
حجم مجموعه داده :
168.81 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
حجم دانلود :
90.90 KiB
حجم مجموعه داده :
195.53 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_jv
حجم دانلود :
13.59 KiB
اندازه مجموعه داده :
35.01 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 205 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ka
حجم دانلود :
70.47 KiB
حجم مجموعه داده :
148.67 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 746 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
حجم دانلود :
46.07 KiB
حجم مجموعه داده :
106.25 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 575 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
حجم دانلود :
77.28 KiB
حجم مجموعه داده :
181.88 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ml
حجم دانلود :
92.50 KiB
حجم مجموعه داده :
165.14 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 687 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_mr
حجم دانلود :
98.19 KiB
حجم مجموعه داده :
202.96 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
حجم دانلود :
71.55 KiB
حجم مجموعه داده :
176.10 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
حجم دانلود :
73.42 KiB
حجم مجموعه داده :
177.95 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
حجم دانلود :
90.30 KiB
حجم مجموعه داده :
194.92 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
حجم دانلود :
19.99 KiB
اندازه مجموعه داده :
60.75 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 390 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ta
حجم دانلود :
38.52 KiB
حجم مجموعه داده :
70.93 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 307 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_te
حجم دانلود :
24.55 KiB
اندازه مجموعه داده :
49.07 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 234 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_th
حجم دانلود :
61.72 KiB
حجم مجموعه داده :
119.32 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 548 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_tl
حجم دانلود :
66.54 KiB
حجم مجموعه داده :
171.04 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_tr
حجم دانلود :
70.20 KiB
حجم مجموعه داده :
174.70 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ur
حجم دانلود :
86.63 KiB
حجم مجموعه داده :
191.20 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_vi
حجم دانلود :
89.26 KiB
حجم مجموعه داده :
193.89 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_zh
حجم دانلود :
67.32 KiB
اندازه مجموعه داده :
171.85 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
- توضیحات :
این داده ها از مجموعه Tatoeba مورخ شنبه 2018/11/17 استخراج شده است.
برای هر زبان، ما 1000 جمله انگلیسی و ترجمه آنها را در صورت وجود انتخاب کرده ایم. لطفاً این مقاله را برای توضیح زبانها، خانوادهها و اسکریپتها و همچنین نتایج پایه بررسی کنید.
لطفاً توجه داشته باشید که جملات انگلیسی برای همه جفتهای زبانی یکسان نیستند. این بدان معنی است که نتایج به طور مستقیم در بین زبان ها قابل مقایسه نیستند.
صفحه اصلی : http://opus.nlpl.eu/Tatoeba.php
کد منبع :
tfds.datasets.tatoeba.Builder
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
ذخیره خودکار ( اسناد ): بله
ساختار ویژگی :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
منبع_زبان | متن | رشته | ||
منبع_جمله | متن | رشته | ||
زبان مقصد | متن | رشته | ||
هدف_جمله | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af (پیکربندی پیش فرض)
حجم دانلود :
58.24 KiB
حجم مجموعه داده :
162.74 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ar
حجم دانلود :
70.95 KiB
حجم مجموعه داده :
175.46 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
حجم دانلود :
99.88 KiB
اندازه مجموعه داده :
204.64 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_bn
حجم دانلود :
89.55 KiB
حجم مجموعه داده :
194.24 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_de
حجم دانلود :
103.09 KiB
حجم مجموعه داده :
207.93 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_el
حجم دانلود :
77.11 KiB
حجم مجموعه داده :
181.65 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_es
حجم دانلود :
70.57 KiB
حجم مجموعه داده :
175.12 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_et
حجم دانلود :
58.33 KiB
حجم مجموعه داده :
162.85 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_eu
حجم دانلود :
64.52 KiB
اندازه مجموعه داده :
169.02 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_fa
حجم دانلود :
91.52 KiB
حجم مجموعه داده :
196.15 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_fi
حجم دانلود :
73.90 KiB
حجم مجموعه داده :
178.47 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_fr
حجم دانلود :
78.14 KiB
اندازه مجموعه داده :
182.68 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_he
حجم دانلود :
81.54 KiB
حجم مجموعه داده :
186.15 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_hi
حجم دانلود :
119.69 KiB
حجم مجموعه داده :
224.89 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_hu
حجم دانلود :
67.27 KiB
حجم مجموعه داده :
171.78 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_id
حجم دانلود :
73.09 KiB
حجم مجموعه داده :
177.61 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_it
حجم دانلود :
64.29 KiB
حجم مجموعه داده :
168.81 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
حجم دانلود :
90.90 KiB
حجم مجموعه داده :
195.53 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_jv
حجم دانلود :
13.59 KiB
اندازه مجموعه داده :
35.01 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 205 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ka
حجم دانلود :
70.47 KiB
حجم مجموعه داده :
148.67 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 746 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
حجم دانلود :
46.07 KiB
حجم مجموعه داده :
106.25 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 575 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
حجم دانلود :
77.28 KiB
حجم مجموعه داده :
181.88 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ml
حجم دانلود :
92.50 KiB
حجم مجموعه داده :
165.14 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 687 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_mr
حجم دانلود :
98.19 KiB
حجم مجموعه داده :
202.96 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
حجم دانلود :
71.55 KiB
حجم مجموعه داده :
176.10 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
حجم دانلود :
73.42 KiB
حجم مجموعه داده :
177.95 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
حجم دانلود :
90.30 KiB
حجم مجموعه داده :
194.92 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
حجم دانلود :
19.99 KiB
اندازه مجموعه داده :
60.75 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 390 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ta
حجم دانلود :
38.52 KiB
حجم مجموعه داده :
70.93 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 307 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_te
حجم دانلود :
24.55 KiB
اندازه مجموعه داده :
49.07 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 234 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_th
حجم دانلود :
61.72 KiB
حجم مجموعه داده :
119.32 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 548 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_tl
حجم دانلود :
66.54 KiB
حجم مجموعه داده :
171.04 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_tr
حجم دانلود :
70.20 KiB
حجم مجموعه داده :
174.70 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_ur
حجم دانلود :
86.63 KiB
حجم مجموعه داده :
191.20 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_vi
حجم دانلود :
89.26 KiB
حجم مجموعه داده :
193.89 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):
tatoeba/tatoeba_zh
حجم دانلود :
67.32 KiB
اندازه مجموعه داده :
171.85 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- مثالها ( tfds.as_dataframe ):