- คำอธิบาย :
ข้อมูลนี้ดึงมาจาก Tatoeba corpus ลงวันที่ 11/2018/11/17
สำหรับแต่ละภาษา เราได้เลือก 1,000 ประโยคภาษาอังกฤษและคำแปล ถ้ามี โปรดตรวจสอบเอกสารนี้เพื่อดูคำอธิบายของภาษา ตระกูลและสคริปต์ รวมทั้งผลลัพธ์พื้นฐาน
โปรดทราบว่าประโยคภาษาอังกฤษนั้นไม่เหมือนกันสำหรับทุกคู่ภาษา ซึ่งหมายความว่าผลลัพธ์จะไม่สามารถเปรียบเทียบได้โดยตรงในภาษาต่างๆ
โฮมเพจ : http://opus.nlpl.eu/Tatoeba.php
รหัสที่มา :
tfds.datasets.tatoeba.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
แคชอัตโนมัติ ( เอกสาร ): ใช่
โครงสร้างคุณลักษณะ :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
source_language | ข้อความ | สตริง | ||
source_sentence | ข้อความ | สตริง | ||
ภาษาเป้าหมาย | ข้อความ | สตริง | ||
target_sentence | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af (การกำหนดค่าเริ่มต้น)
ขนาดการดาวน์โหลด :
58.24 KiB
ขนาดชุดข้อมูล :
162.74 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ar
ขนาดการดาวน์โหลด :
70.95 KiB
ขนาดชุดข้อมูล :
175.46 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
ขนาดการดาวน์โหลด :
99.88 KiB
ขนาดชุดข้อมูล :
204.64 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_bn
ขนาดการดาวน์โหลด :
89.55 KiB
ขนาดชุดข้อมูล :
194.24 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_de
ขนาดการดาวน์โหลด :
103.09 KiB
ขนาดชุดข้อมูล :
207.93 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_el
ขนาดการดาวน์โหลด :
77.11 KiB
ขนาดชุดข้อมูล :
181.65 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_es
ขนาดการดาวน์โหลด :
70.57 KiB
ขนาดชุดข้อมูล :
175.12 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_et
ขนาดการดาวน์โหลด :
58.33 KiB
ขนาดชุดข้อมูล :
162.85 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_eu
ขนาดการดาวน์โหลด :
64.52 KiB
ขนาดชุดข้อมูล :
169.02 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_fa
ขนาดการดาวน์โหลด :
91.52 KiB
ขนาดชุดข้อมูล :
196.15 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_fi
ขนาดการดาวน์โหลด :
73.90 KiB
ขนาดชุดข้อมูล :
178.47 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_fr
ขนาดการดาวน์โหลด :
78.14 KiB
ขนาดชุดข้อมูล :
182.68 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_he
ขนาดการดาวน์โหลด :
81.54 KiB
ขนาดชุดข้อมูล :
186.15 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_hi
ขนาดการดาวน์โหลด :
119.69 KiB
ขนาดชุดข้อมูล :
224.89 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_hu
ขนาดการดาวน์โหลด :
67.27 KiB
ขนาดชุดข้อมูล :
171.78 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_id
ขนาดการดาวน์โหลด :
73.09 KiB
ขนาดชุดข้อมูล :
177.61 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_it
ขนาดการดาวน์โหลด :
64.29 KiB
ขนาดชุดข้อมูล :
168.81 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
ขนาดการดาวน์โหลด :
90.90 KiB
ขนาดชุดข้อมูล :
195.53 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_jv
ขนาดการดาวน์โหลด :
13.59 KiB
ขนาดชุดข้อมูล :
35.01 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 205 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ka
ขนาดการดาวน์โหลด :
70.47 KiB
ขนาดชุดข้อมูล :
148.67 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 746 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
ขนาดการดาวน์โหลด :
46.07 KiB
ขนาดชุดข้อมูล :
106.25 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 575 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
ขนาดการดาวน์โหลด :
77.28 KiB
ขนาดชุดข้อมูล :
181.88 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ml
ขนาดการดาวน์โหลด :
92.50 KiB
ขนาดชุดข้อมูล :
165.14 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 687 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_mr
ขนาดการดาวน์โหลด :
98.19 KiB
ขนาดชุดข้อมูล :
202.96 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
ขนาดการดาวน์โหลด :
71.55 KiB
ขนาดชุดข้อมูล :
176.10 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
ขนาดการดาวน์โหลด :
73.42 KiB
ขนาดชุดข้อมูล :
177.95 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
ขนาดการดาวน์โหลด :
90.30 KiB
ขนาดชุดข้อมูล :
194.92 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
ขนาดการดาวน์โหลด :
19.99 KiB
ขนาดชุดข้อมูล :
60.75 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 390 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ta
ขนาดการดาวน์โหลด :
38.52 KiB
ขนาดชุดข้อมูล :
70.93 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 307 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_te
ขนาดการดาวน์โหลด :
24.55 KiB
ขนาดชุดข้อมูล :
49.07 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 234 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_th
ขนาดการดาวน์โหลด :
61.72 KiB
ขนาดชุดข้อมูล :
119.32 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 548 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_tl
ขนาดการดาวน์โหลด :
66.54 KiB
ขนาดชุดข้อมูล :
171.04 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_tr
ขนาดการดาวน์โหลด :
70.20 KiB
ขนาดชุดข้อมูล :
174.70 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ur
ขนาดการดาวน์โหลด :
86.63 KiB
ขนาดชุดข้อมูล :
191.20 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_vi
ขนาดการดาวน์โหลด :
89.26 KiB
ขนาดชุดข้อมูล :
193.89 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_zh
ขนาดการดาวน์โหลด :
67.32 KiB
ขนาดชุดข้อมูล :
171.85 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):