- Deskripsi :
Kumpulan data berasal dari transkrip pembicaraan TED untuk membandingkan pasangan bahasa yang serupa di mana yang satu memiliki sumber daya yang tinggi dan yang lainnya memiliki sumber daya yang rendah.
Kode sumber :
tfds.datasets.ted_hrlr_translate.Builder
Versi :
-
1.0.0
(default): API split baru ( https://tensorflow.org/datasets/splits )
-
Ukuran unduhan :
124.94 MiB
Di-cache otomatis ( dokumentasi ): Ya
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate/az_to_en (konfigurasi default)
Deskripsi konfigurasi : Terjemahan dataset dari az ke en dalam teks biasa.
Ukuran dataset :
1.61 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 903 |
'train' | 5.946 |
'validation' | 671 |
- Struktur fitur :
Translation({
'az': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
az | Teks | rangkaian | ||
en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('az', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
Deskripsi konfigurasi : Terjemahan dataset dari az_tr ke en dalam teks biasa.
Ukuran dataset :
42.54 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 903 |
'train' | 188.396 |
'validation' | 671 |
- Struktur fitur :
Translation({
'az_tr': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
az_tr | Teks | rangkaian | ||
en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('az_tr', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
Deskripsi konfigurasi : Terjemahan dataset dari be ke en dalam teks biasa.
Ukuran dataset :
1.47 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 664 |
'train' | 4.509 |
'validation' | 248 |
- Struktur fitur :
Translation({
'be': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
menjadi | Teks | rangkaian | ||
en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('be', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_en
Deskripsi konfigurasi : Terjemahan dataset dari be_ru ke en dalam teks biasa.
Ukuran dataset :
62.45 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 664 |
'train' | 212.614 |
'validation' | 248 |
- Struktur fitur :
Translation({
'be_ru': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
be_ru | Teks | rangkaian | ||
en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('be_ru', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
Deskripsi konfigurasi : Terjemahan dataset dari es ke pt dalam teks biasa.
Ukuran dataset :
9.62 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1.763 |
'train' | 44.938 |
'validation' | 1.016 |
- Struktur fitur :
Translation({
'es': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
es | Teks | rangkaian | ||
pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('es', 'pt')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
Deskripsi konfigurasi : Terjemahan dataset dari fr ke pt dalam teks biasa.
Ukuran dataset :
9.74 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1.494 |
'train' | 43.873 |
'validation' | 1.131 |
- Struktur fitur :
Translation({
'fr': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
fr | Teks | rangkaian | ||
pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('fr', 'pt')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_en
Deskripsi konfigurasi : Terjemahan dataset dari gl ke en dalam teks biasa.
Ukuran dataset :
2.41 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1.007 |
'train' | 10.017 |
'validation' | 682 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'gl': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
en | Teks | rangkaian | ||
gl | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('gl', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_en
Deskripsi konfigurasi : Terjemahan dataset dari gl_pt ke en dalam teks biasa.
Ukuran dataset :
12.90 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1.007 |
'train' | 61.802 |
'validation' | 682 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'gl_pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
en | Teks | rangkaian | ||
gl_pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('gl_pt', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
Deskripsi konfigurasi : Terjemahan dataset dari he ke pt dalam teks biasa.
Ukuran dataset :
11.71 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1.623 |
'train' | 48.511 |
'validation' | 1.145 |
- Struktur fitur :
Translation({
'he': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
Dia | Teks | rangkaian | ||
pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('he', 'pt')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
Deskripsi konfigurasi : Terjemahan dataset dari itu ke pt dalam teks biasa.
Ukuran dataset :
9.94 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1.669 |
'train' | 46.259 |
'validation' | 1.162 |
- Struktur fitur :
Translation({
'it': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
dia | Teks | rangkaian | ||
pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('it', 'pt')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_en
Deskripsi konfigurasi : Terjemahan dataset dari pt ke en dalam teks biasa.
Ukuran dataset :
10.89 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1.803 |
'train' | 51.785 |
'validation' | 1.193 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
en | Teks | rangkaian | ||
pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('pt', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_en
Deskripsi konfigurasi : Terjemahan dataset dari ru ke en dalam teks biasa.
Ukuran dataset :
63.22 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 5.476 |
'train' | 208.106 |
'validation' | 4.805 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
en | Teks | rangkaian | ||
ru | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('ru', 'en')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
Deskripsi konfigurasi : Terjemahan dataset dari ru ke pt dalam teks biasa.
Ukuran dataset :
13.00 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1.588 |
'train' | 47.278 |
'validation' | 1.184 |
- Struktur fitur :
Translation({
'pt': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
pt | Teks | rangkaian | ||
ru | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('ru', 'pt')
Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_en
Deskripsi konfigurasi : Terjemahan dataset dari tr ke en dalam teks biasa.
Ukuran dataset :
42.33 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 5.029 |
'train' | 182.450 |
'validation' | 4.045 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
Terjemahan | ||||
en | Teks | rangkaian | ||
tr | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('tr', 'en')
Contoh ( tfds.as_dataframe ):