- Mô tả :
Các tập dữ liệu được lấy từ các bản ghi cuộc trò chuyện TED để so sánh các cặp ngôn ngữ tương tự, trong đó một là tài nguyên cao và tài nguyên kia là tài nguyên thấp.
Trang chủ : https://github.com/neulab/word-embeddings-for-nmt
Mã nguồn :
tfds.translate.TedHrlrTranslate
Các phiên bản :
-
1.0.0
(mặc định): API phân tách mới ( https://tensorflow.org/datasets/splits )
-
Kích thước tải xuống :
124.94 MiB
Kích thước tập dữ liệu :
Unknown size
Tự động lưu trong bộ nhớ đệm ( tài liệu ): Không xác định
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ): Thiếu.
Trích dẫn :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate / az_to_en (cấu hình mặc định)
Mô tả cấu hình : Dịch tập dữ liệu từ az sang en ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 903 |
'train' | 5.946 |
'validation' | 671 |
- Cấu trúc tính năng :
Translation({
'az': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
az | Chữ | tf.string | ||
en | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('az', 'en')
ted_hrlr_translate / aztr_to_en
Mô tả cấu hình : Dịch tập dữ liệu từ az_tr sang en ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 903 |
'train' | 188.396 |
'validation' | 671 |
- Cấu trúc tính năng :
Translation({
'az_tr': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
az_tr | Chữ | tf.string | ||
en | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('az_tr', 'en')
ted_hrlr_translate / be_to_en
Mô tả cấu hình : Dịch tập dữ liệu từ be sang en ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 664 |
'train' | 4.509 |
'validation' | 248 |
- Cấu trúc tính năng :
Translation({
'be': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
thì là ở | Chữ | tf.string | ||
en | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('be', 'en')
ted_hrlr_translate / beru_to_en
Mô tả cấu hình : Dịch tập dữ liệu từ be_ru sang en ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 664 |
'train' | 212.614 |
'validation' | 248 |
- Cấu trúc tính năng :
Translation({
'be_ru': Text(shape=(), dtype=tf.string),
'en': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
be_ru | Chữ | tf.string | ||
en | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('be_ru', 'en')
ted_hrlr_translate / es_to_pt
Mô tả cấu hình : Dịch tập dữ liệu từ es sang pt ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 1.763 |
'train' | 44,938 |
'validation' | 1,016 |
- Cấu trúc tính năng :
Translation({
'es': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
es | Chữ | tf.string | ||
pt | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('es', 'pt')
ted_hrlr_translate / fr_to_pt
Mô tả cấu hình : Dịch tập dữ liệu từ fr sang pt ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 1.494 |
'train' | 43.873 |
'validation' | 1.131 |
- Cấu trúc tính năng :
Translation({
'fr': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
fr | Chữ | tf.string | ||
pt | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('fr', 'pt')
ted_hrlr_translate / gl_to_en
Mô tả cấu hình : Dịch tập dữ liệu từ gl sang en ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 1.007 |
'train' | 10.017 |
'validation' | 682 |
- Cấu trúc tính năng :
Translation({
'en': Text(shape=(), dtype=tf.string),
'gl': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
en | Chữ | tf.string | ||
gl | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('gl', 'en')
ted_hrlr_translate / glpt_to_en
Mô tả cấu hình : Dịch tập dữ liệu từ gl_pt sang en ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 1.007 |
'train' | 61,802 |
'validation' | 682 |
- Cấu trúc tính năng :
Translation({
'en': Text(shape=(), dtype=tf.string),
'gl_pt': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
en | Chữ | tf.string | ||
gl_pt | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('gl_pt', 'en')
ted_hrlr_translate / he_to_pt
Mô tả cấu hình : Dịch tập dữ liệu từ anh ấy sang pt ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 1.623 |
'train' | 48.511 |
'validation' | 1.145 |
- Cấu trúc tính năng :
Translation({
'he': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
anh ta | Chữ | tf.string | ||
pt | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('he', 'pt')
ted_hrlr_translate / it_to_pt
Mô tả cấu hình : Dịch tập dữ liệu từ nó sang pt ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 1.669 |
'train' | 46.259 |
'validation' | 1.162 |
- Cấu trúc tính năng :
Translation({
'it': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
nó | Chữ | tf.string | ||
pt | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('it', 'pt')
ted_hrlr_translate / pt_to_en
Mô tả cấu hình : Dịch tập dữ liệu từ pt sang en ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 1.803 |
'train' | 51.785 |
'validation' | 1.193 |
- Cấu trúc tính năng :
Translation({
'en': Text(shape=(), dtype=tf.string),
'pt': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
en | Chữ | tf.string | ||
pt | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('pt', 'en')
ted_hrlr_translate / ru_to_en
Mô tả cấu hình : Dịch tập dữ liệu từ ru sang en ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 5.476 |
'train' | 208.106 |
'validation' | 4.805 |
- Cấu trúc tính năng :
Translation({
'en': Text(shape=(), dtype=tf.string),
'ru': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
en | Chữ | tf.string | ||
ru | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('ru', 'en')
ted_hrlr_translate / ru_to_pt
Mô tả cấu hình : Dịch tập dữ liệu từ ru sang pt ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 1.588 |
'train' | 47.278 |
'validation' | 1.184 |
- Cấu trúc tính năng :
Translation({
'pt': Text(shape=(), dtype=tf.string),
'ru': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
pt | Chữ | tf.string | ||
ru | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('ru', 'pt')
ted_hrlr_translate / tr_to_en
Mô tả cấu hình : Dịch tập dữ liệu từ tr sang en ở dạng văn bản thuần túy.
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 5,029 |
'train' | 182.450 |
'validation' | 4.045 |
- Cấu trúc tính năng :
Translation({
'en': Text(shape=(), dtype=tf.string),
'tr': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Dịch | ||||
en | Chữ | tf.string | ||
tr | Chữ | tf.string |
- Các khóa được giám sát (Xem
as_supervised
doc ):('tr', 'en')