- 설명 :
이 데이터는 2018/11/17 토요일 날짜의 Tatoeba 말뭉치에서 추출되었습니다.
각 언어에 대해 가능한 경우 1000개의 영어 문장과 해당 번역을 선택했습니다. 언어, 어족, 스크립트 및 기본 결과에 대한 설명은 이 문서를 확인하십시오.
영어 문장은 모든 언어 쌍에서 동일하지 않습니다. 이는 결과가 언어 간에 직접 비교할 수 없음을 의미합니다.
소스 코드 :
tfds.datasets.tatoeba.Builder
버전 :
-
1.0.0
(기본값): 최초 릴리스.
-
자동 캐시 ( 문서 ): 예
기능 구조 :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
source_language | 텍스트 | 끈 | ||
source_sentence | 텍스트 | 끈 | ||
대상 언어 | 텍스트 | 끈 | ||
target_sentence | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af(기본 구성)
다운로드 크기 :
58.24 KiB
데이터 세트 크기 :
162.74 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_ar
다운로드 크기 :
70.95 KiB
데이터 세트 크기 :
175.46 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
다운로드 크기 :
99.88 KiB
데이터 세트 크기 :
204.64 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_bn
다운로드 크기 :
89.55 KiB
데이터 세트 크기 :
194.24 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_de
다운로드 크기 :
103.09 KiB
데이터 세트 크기 :
207.93 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_el
다운로드 크기 :
77.11 KiB
데이터 세트 크기 :
181.65 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_es
다운로드 크기 :
70.57 KiB
데이터 세트 크기 :
175.12 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_et
다운로드 크기 :
58.33 KiB
데이터 세트 크기 :
162.85 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_eu
다운로드 크기 :
64.52 KiB
데이터 세트 크기 :
169.02 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_fa
다운로드 크기 :
91.52 KiB
데이터 세트 크기 :
196.15 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_fi
다운로드 크기 :
73.90 KiB
데이터 세트 크기 :
178.47 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_fr
다운로드 크기 :
78.14 KiB
데이터 세트 크기 :
182.68 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_he
다운로드 크기 :
81.54 KiB
데이터 세트 크기 :
186.15 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_hi
다운로드 크기 :
119.69 KiB
데이터 세트 크기 :
224.89 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_hu
다운로드 크기 :
67.27 KiB
데이터 세트 크기 :
171.78 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_id
다운로드 크기 :
73.09 KiB
데이터 세트 크기 :
177.61 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_it
다운로드 크기 :
64.29 KiB
데이터 세트 크기 :
168.81 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
다운로드 크기 :
90.90 KiB
데이터 세트 크기 :
195.53 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_jv
다운로드 크기 :
13.59 KiB
데이터 세트 크기 :
35.01 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 205 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_ka
다운로드 크기 :
70.47 KiB
데이터 세트 크기 :
148.67 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 746 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
다운로드 크기 :
46.07 KiB
데이터 세트 크기 :
106.25 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 575 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
다운로드 크기 :
77.28 KiB
데이터 세트 크기 :
181.88 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_ml
다운로드 크기 :
92.50 KiB
데이터 세트 크기 :
165.14 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 687 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_mr
다운로드 크기 :
98.19 KiB
데이터 세트 크기 :
202.96 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
다운로드 크기 :
71.55 KiB
데이터 세트 크기 :
176.10 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
다운로드 크기 :
73.42 KiB
데이터 세트 크기 :
177.95 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
다운로드 크기 :
90.30 KiB
데이터 세트 크기 :
194.92 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
다운로드 크기 :
19.99 KiB
데이터 세트 크기 :
60.75 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 390 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_ta
다운로드 크기 :
38.52 KiB
데이터 세트 크기 :
70.93 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 307 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_te
다운로드 크기 :
24.55 KiB
데이터 세트 크기 :
49.07 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 234 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_th
다운로드 크기 :
61.72 KiB
데이터 세트 크기 :
119.32 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 548 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_tl
다운로드 크기 :
66.54 KiB
데이터 세트 크기 :
171.04 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_tr
다운로드 크기 :
70.20 KiB
데이터 세트 크기 :
174.70 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_ur
다운로드 크기 :
86.63 KiB
데이터 세트 크기 :
191.20 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_vi
다운로드 크기 :
89.26 KiB
데이터 세트 크기 :
193.89 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_zh
다운로드 크기 :
67.32 KiB
데이터 세트 크기 :
171.85 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
- 설명 :
이 데이터는 2018/11/17 토요일 날짜의 Tatoeba 말뭉치에서 추출되었습니다.
각 언어에 대해 가능한 경우 1000개의 영어 문장과 해당 번역을 선택했습니다. 언어, 어족, 스크립트 및 기본 결과에 대한 설명은 이 문서를 확인하십시오.
영어 문장은 모든 언어 쌍에서 동일하지 않습니다. 이는 결과가 언어 간에 직접 비교할 수 없음을 의미합니다.
소스 코드 :
tfds.datasets.tatoeba.Builder
버전 :
-
1.0.0
(기본값): 최초 릴리스.
-
자동 캐시 ( 문서 ): 예
기능 구조 :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
source_language | 텍스트 | 끈 | ||
source_sentence | 텍스트 | 끈 | ||
대상 언어 | 텍스트 | 끈 | ||
target_sentence | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af(기본 구성)
다운로드 크기 :
58.24 KiB
데이터 세트 크기 :
162.74 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_ar
다운로드 크기 :
70.95 KiB
데이터 세트 크기 :
175.46 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
다운로드 크기 :
99.88 KiB
데이터 세트 크기 :
204.64 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_bn
다운로드 크기 :
89.55 KiB
데이터 세트 크기 :
194.24 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_de
다운로드 크기 :
103.09 KiB
데이터 세트 크기 :
207.93 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_el
다운로드 크기 :
77.11 KiB
데이터 세트 크기 :
181.65 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_es
다운로드 크기 :
70.57 KiB
데이터 세트 크기 :
175.12 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_et
다운로드 크기 :
58.33 KiB
데이터 세트 크기 :
162.85 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_eu
다운로드 크기 :
64.52 KiB
데이터 세트 크기 :
169.02 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_fa
다운로드 크기 :
91.52 KiB
데이터 세트 크기 :
196.15 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_fi
다운로드 크기 :
73.90 KiB
데이터 세트 크기 :
178.47 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_fr
다운로드 크기 :
78.14 KiB
데이터 세트 크기 :
182.68 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_he
다운로드 크기 :
81.54 KiB
데이터 세트 크기 :
186.15 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_hi
다운로드 크기 :
119.69 KiB
데이터 세트 크기 :
224.89 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_hu
다운로드 크기 :
67.27 KiB
데이터 세트 크기 :
171.78 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_id
다운로드 크기 :
73.09 KiB
데이터 세트 크기 :
177.61 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_it
다운로드 크기 :
64.29 KiB
데이터 세트 크기 :
168.81 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
다운로드 크기 :
90.90 KiB
데이터 세트 크기 :
195.53 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_jv
다운로드 크기 :
13.59 KiB
데이터 세트 크기 :
35.01 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 205 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_ka
다운로드 크기 :
70.47 KiB
데이터 세트 크기 :
148.67 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 746 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
다운로드 크기 :
46.07 KiB
데이터 세트 크기 :
106.25 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 575 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
다운로드 크기 :
77.28 KiB
데이터 세트 크기 :
181.88 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_ml
다운로드 크기 :
92.50 KiB
데이터 세트 크기 :
165.14 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 687 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_mr
다운로드 크기 :
98.19 KiB
데이터 세트 크기 :
202.96 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
다운로드 크기 :
71.55 KiB
데이터 세트 크기 :
176.10 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
다운로드 크기 :
73.42 KiB
데이터 세트 크기 :
177.95 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
다운로드 크기 :
90.30 KiB
데이터 세트 크기 :
194.92 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
다운로드 크기 :
19.99 KiB
데이터 세트 크기 :
60.75 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 390 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_ta
다운로드 크기 :
38.52 KiB
데이터 세트 크기 :
70.93 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 307 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_te
다운로드 크기 :
24.55 KiB
데이터 세트 크기 :
49.07 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 234 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_th
다운로드 크기 :
61.72 KiB
데이터 세트 크기 :
119.32 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 548 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_tl
다운로드 크기 :
66.54 KiB
데이터 세트 크기 :
171.04 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_tr
다운로드 크기 :
70.20 KiB
데이터 세트 크기 :
174.70 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_ur
다운로드 크기 :
86.63 KiB
데이터 세트 크기 :
191.20 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_vi
다운로드 크기 :
89.26 KiB
데이터 세트 크기 :
193.89 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):
타토에바/tatoeba_zh
다운로드 크기 :
67.32 KiB
데이터 세트 크기 :
171.85 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,000 |
- 예 ( tfds.as_dataframe ):