- opis :
Te dane pochodzą z korpusu Tatoeba z soboty 2018/11/17.
Dla każdego języka wybraliśmy 1000 angielskich zdań i ich tłumaczeń, jeśli są dostępne. Sprawdź ten artykuł, aby uzyskać opis języków, ich rodzin i skryptów, a także wyniki bazowe.
Należy pamiętać, że angielskie zdania nie są identyczne dla wszystkich par językowych. Oznacza to, że wyniki nie są bezpośrednio porównywalne w różnych językach.
Strona główna : http://opus.nlpl.eu/Tatoeba.php
Kod źródłowy :
tfds.datasets.tatoeba.Builder
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Automatyczne buforowanie ( dokumentacja ): Tak
Struktura funkcji :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
język źródłowy | Tekst | strunowy | ||
zdanie_źródłowe | Tekst | strunowy | ||
język docelowy | Tekst | strunowy | ||
zdanie_docelowe | Tekst | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af (domyślna konfiguracja)
Rozmiar pliku do pobrania :
58.24 KiB
Rozmiar zbioru danych :
162.74 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ar
Rozmiar pliku do pobrania :
70.95 KiB
Rozmiar zbioru danych :
175.46 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
Rozmiar pliku do pobrania :
99.88 KiB
Rozmiar zbioru danych :
204.64 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_bn
Rozmiar pliku do pobrania :
89.55 KiB
Rozmiar zbioru danych :
194.24 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_de
Rozmiar pliku do pobrania :
103.09 KiB
Rozmiar zbioru danych :
207.93 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_el
Rozmiar pliku do pobrania :
77.11 KiB
Rozmiar zbioru danych :
181.65 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_es
Rozmiar pliku do pobrania :
70.57 KiB
Rozmiar zbioru danych :
175.12 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_et
Rozmiar pliku do pobrania :
58.33 KiB
Rozmiar zbioru danych :
162.85 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_eu
Rozmiar pliku do pobrania :
64.52 KiB
Rozmiar zbioru danych :
169.02 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_fa
Rozmiar pliku do pobrania :
91.52 KiB
Rozmiar zbioru danych :
196.15 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_fi
Rozmiar pliku do pobrania :
73.90 KiB
Rozmiar zbioru danych :
178.47 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_fr
Rozmiar pliku do pobrania :
78.14 KiB
Rozmiar zbioru danych :
182.68 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_he
Rozmiar pliku do pobrania :
81.54 KiB
Rozmiar zbioru danych :
186.15 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_hi
Rozmiar pliku do pobrania :
119.69 KiB
Rozmiar zbioru danych :
224.89 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_hu
Rozmiar pliku do pobrania :
67.27 KiB
Rozmiar zbioru danych :
171.78 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_id
Rozmiar pliku do pobrania :
73.09 KiB
Rozmiar zbioru danych :
177.61 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_it
Rozmiar pliku do pobrania :
64.29 KiB
Rozmiar zbioru danych :
168.81 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
Rozmiar pliku do pobrania :
90.90 KiB
Rozmiar zbioru danych :
195.53 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_jv
Rozmiar pliku do pobrania :
13.59 KiB
Rozmiar zbioru danych :
35.01 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 205 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ka
Rozmiar pliku do pobrania :
70.47 KiB
Rozmiar zbioru danych :
148.67 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 746 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
Rozmiar pliku do pobrania :
46.07 KiB
Rozmiar zbioru danych :
106.25 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 575 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
Rozmiar pliku do pobrania :
77.28 KiB
Rozmiar zbioru danych :
181.88 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ml
Rozmiar pliku do pobrania :
92.50 KiB
Rozmiar zbioru danych :
165.14 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 687 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_mr
Rozmiar pliku do pobrania :
98.19 KiB
Rozmiar zbioru danych :
202.96 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
Rozmiar pliku do pobrania :
71.55 KiB
Rozmiar zbioru danych :
176.10 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
Rozmiar pliku do pobrania :
73.42 KiB
Rozmiar zbioru danych :
177.95 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
Rozmiar pliku do pobrania :
90.30 KiB
Rozmiar zbioru danych :
194.92 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
Rozmiar pliku do pobrania :
19.99 KiB
Rozmiar zestawu danych :
60.75 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 390 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ta
Rozmiar pliku do pobrania :
38.52 KiB
Rozmiar zbioru danych :
70.93 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 307 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_te
Rozmiar pliku do pobrania :
24.55 KiB
Rozmiar zbioru danych :
49.07 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 234 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_th
Rozmiar pliku do pobrania :
61.72 KiB
Rozmiar zbioru danych :
119.32 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 548 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_tl
Rozmiar pliku do pobrania :
66.54 KiB
Rozmiar zbioru danych :
171.04 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_tr
Rozmiar pliku do pobrania :
70.20 KiB
Rozmiar zbioru danych :
174.70 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ur
Rozmiar pliku do pobrania :
86.63 KiB
Rozmiar zbioru danych :
191.20 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_vi
Rozmiar pliku do pobrania :
89.26 KiB
Rozmiar zbioru danych :
193.89 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_zh
Rozmiar pliku do pobrania :
67.32 KiB
Rozmiar zbioru danych :
171.85 KiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):