- Açıklama :
Bu veriler, Cumartesi 2018/11/17 tarihli Tatoeba külliyatından alınmıştır.
Her dil için 1000 İngilizce cümle ve varsa çevirilerini seçtik. Dillerin, ailelerinin ve alfabelerinin yanı sıra temel sonuçların bir açıklaması için lütfen bu makaleyi kontrol edin.
Lütfen İngilizce cümlelerin tüm dil çiftleri için aynı olmadığını unutmayın. Bu, sonuçların diller arasında doğrudan karşılaştırılamayacağı anlamına gelir.
Ana sayfa : http://opus.nlpl.eu/Tatoeba.php
Kaynak kodu :
tfds.datasets.tatoeba.Builder
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
Otomatik önbelleğe alınmış ( belgeleme ): Evet
Özellik yapısı :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
kaynak dil | Metin | sicim | ||
kaynak_sentence | Metin | sicim | ||
hedef dil | Metin | sicim | ||
hedef cümle | Metin | sicim |
Denetlenen anahtarlar (Bkz.
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af (varsayılan yapılandırma)
İndirme boyutu :
58.24 KiB
Veri kümesi boyutu :
162.74 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_ar
İndirme boyutu :
70.95 KiB
Veri kümesi boyutu :
175.46 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
İndirme boyutu :
99.88 KiB
Veri kümesi boyutu :
204.64 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_bn
İndirme boyutu :
89.55 KiB
Veri kümesi boyutu :
194.24 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_de
İndirme boyutu :
103.09 KiB
Veri kümesi boyutu :
207.93 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_el
İndirme boyutu :
77.11 KiB
Veri kümesi boyutu :
181.65 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_es
İndirme boyutu :
70.57 KiB
Veri kümesi boyutu :
175.12 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_et
İndirme boyutu :
58.33 KiB
Veri kümesi boyutu :
162.85 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_eu
İndirme boyutu :
64.52 KiB
Veri kümesi boyutu :
169.02 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_fa
İndirme boyutu :
91.52 KiB
Veri kümesi boyutu :
196.15 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_fi
İndirme boyutu :
73.90 KiB
Veri kümesi boyutu :
178.47 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_fr
İndirme boyutu :
78.14 KiB
Veri kümesi boyutu :
182.68 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_he
İndirme boyutu :
81.54 KiB
Veri kümesi boyutu :
186.15 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_hi
İndirme boyutu :
119.69 KiB
Veri kümesi boyutu :
224.89 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_hu
İndirme boyutu :
67.27 KiB
Veri kümesi boyutu :
171.78 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_id
İndirme boyutu :
73.09 KiB
Veri kümesi boyutu :
177.61 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_it
İndirme boyutu :
64.29 KiB
Veri kümesi boyutu :
168.81 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
İndirme boyutu :
90.90 KiB
Veri kümesi boyutu :
195.53 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_jv
İndirme boyutu :
13.59 KiB
Veri kümesi boyutu :
35.01 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 205 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_ka
İndirme boyutu :
70.47 KiB
Veri kümesi boyutu :
148.67 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 746 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
İndirme boyutu :
46.07 KiB
Veri kümesi boyutu :
106.25 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 575 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
İndirme boyutu :
77.28 KiB
Veri kümesi boyutu :
181.88 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_ml
İndirme boyutu :
92.50 KiB
Veri kümesi boyutu :
165.14 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 687 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_mr
İndirme boyutu :
98.19 KiB
Veri kümesi boyutu :
202.96 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
İndirme boyutu :
71.55 KiB
Veri kümesi boyutu :
176.10 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
İndirme boyutu :
73.42 KiB
Veri kümesi boyutu :
177.95 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
İndirme boyutu :
90.30 KiB
Veri kümesi boyutu :
194.92 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
İndirme boyutu :
19.99 KiB
Veri kümesi boyutu :
60.75 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 390 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_ta
İndirme boyutu :
38.52 KiB
Veri kümesi boyutu :
70.93 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 307 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_te
İndirme boyutu :
24.55 KiB
Veri kümesi boyutu :
49.07 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 234 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_th
İndirme boyutu :
61.72 KiB
Veri kümesi boyutu :
119.32 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 548 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_tl
İndirme boyutu :
66.54 KiB
Veri kümesi boyutu :
171.04 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_tr
İndirme boyutu :
70.20 KiB
Veri kümesi boyutu :
174.70 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_ur
İndirme boyutu :
86.63 KiB
Veri kümesi boyutu :
191.20 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_vi
İndirme boyutu :
89.26 KiB
Veri kümesi boyutu :
193.89 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):
tatoeba/tatoeba_zh
İndirme boyutu :
67.32 KiB
Veri kümesi boyutu :
171.85 KiB
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Örnekler ( tfds.as_dataframe ):