- Descrizione :
Questi dati sono estratti dal corpus di Tatoeba, datato sabato 2018/11/17.
Per ogni lingua, abbiamo selezionato 1000 frasi inglesi e le loro traduzioni, se disponibili. Si prega di controllare questo documento per una descrizione delle lingue, delle loro famiglie e scritture, nonché dei risultati di riferimento.
Si noti che le frasi in inglese non sono identiche per tutte le combinazioni linguistiche. Ciò significa che i risultati non sono direttamente confrontabili tra le lingue.
Pagina iniziale : http://opus.nlpl.eu/Tatoeba.php
Codice sorgente :
tfds.datasets.tatoeba.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Auto-cache ( documentazione ): Sì
Struttura delle caratteristiche :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
linguaggio del codice | Testo | corda | ||
frase_fonte | Testo | corda | ||
lingua di destinazione | Testo | corda | ||
target_frase | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Citazione :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af (configurazione predefinita)
Dimensione del download :
58.24 KiB
Dimensione del set di dati:
162.74 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_ar
Dimensione del download :
70.95 KiB
Dimensione del set di dati:
175.46 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
Dimensione del download :
99.88 KiB
Dimensione del set di dati:
204.64 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_bn
Dimensione del download :
89.55 KiB
Dimensione del set di dati:
194.24 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_de
Dimensione del download :
103.09 KiB
Dimensione del set di dati:
207.93 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_el
Dimensione del download :
77.11 KiB
Dimensione del set di dati:
181.65 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_es
Dimensione del download :
70.57 KiB
Dimensione del set di dati:
175.12 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_et
Dimensione del download :
58.33 KiB
Dimensione del set di dati:
162.85 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_eu
Dimensione del download :
64.52 KiB
Dimensione del set di dati:
169.02 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_fa
Dimensione del download :
91.52 KiB
Dimensione del set di dati:
196.15 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_fi
Dimensione del download :
73.90 KiB
Dimensione del set di dati:
178.47 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_fr
Dimensione del download :
78.14 KiB
Dimensione del set di dati:
182.68 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_he
Dimensione del download :
81.54 KiB
Dimensione del set di dati:
186.15 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_ciao
Dimensione del download :
119.69 KiB
Dimensione del set di dati:
224.89 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_hu
Dimensione del download :
67.27 KiB
Dimensione del set di dati:
171.78 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_id
Dimensione del download :
73.09 KiB
Dimensione del set di dati:
177.61 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_it
Dimensione del download :
64.29 KiB
Dimensione del set di dati:
168.81 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
Dimensione del download :
90.90 KiB
Dimensione del set di dati:
195.53 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_jv
Dimensione del download :
13.59 KiB
Dimensione del set di dati:
35.01 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 205 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_ka
Dimensione del download :
70.47 KiB
Dimensione del set di dati:
148.67 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 746 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
Dimensione del download :
46.07 KiB
Dimensione del set di dati:
106.25 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 575 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
Dimensione del download :
77.28 KiB
Dimensione del set di dati:
181.88 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_ml
Dimensione del download :
92.50 KiB
Dimensione del set di dati:
165.14 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 687 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_mr
Dimensione del download :
98.19 KiB
Dimensione del set di dati:
202.96 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
Dimensione del download :
71.55 KiB
Dimensione del set di dati:
176.10 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
Dimensione del download :
73.42 KiB
Dimensione del set di dati:
177.95 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
Dimensione del download :
90.30 KiB
Dimensione del set di dati:
194.92 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
Dimensione del download :
19.99 KiB
Dimensione del set di dati:
60.75 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 390 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_ta
Dimensione del download :
38.52 KiB
Dimensione del set di dati:
70.93 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 307 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_te
Dimensione del download :
24.55 KiB
Dimensione del set di dati:
49.07 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 234 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_th
Dimensione del download :
61.72 KiB
Dimensione del set di dati:
119.32 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 548 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_tl
Dimensione del download :
66.54 KiB
Dimensione del set di dati:
171.04 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_tr
Dimensione del download :
70.20 KiB
Dimensione del set di dati:
174.70 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_ur
Dimensione del download :
86.63 KiB
Dimensione del set di dati:
191.20 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_vi
Dimensione del download :
89.26 KiB
Dimensione del set di dati:
193.89 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):
tatoeba/tatoeba_zh
Dimensione del download :
67.32 KiB
Dimensione del set di dati:
171.85 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.000 |
- Esempi ( tfds.as_dataframe ):