- Описание :
Наборы данных, полученные из расшифровок выступлений TED, для сравнения похожих языковых пар, где одна из них является ресурсоемкой, а другая — низкоресурсной.
Домашняя страница : https://github.com/neulab/word-embeddings-for-nmt
Исходный код :
tfds.datasets.ted_hrlr_translate.BuilderВерсии :
-
1.0.0(по умолчанию): новый раздельный API ( https://tensorflow.org/datasets/splits )
-
Размер загрузки :
124.94 MiBАвтоматическое кэширование ( документация ): Да
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate/az_to_en (конфигурация по умолчанию)
Описание конфигурации : перевод набора данных с az на en в виде обычного текста.
Размер набора данных :
1.61 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 903 |
'train' | 5946 |
'validation' | 671 |
- Структура функции :
Translation({
'az': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| аз | Текст | нить | ||
| en | Текст | нить |
Контролируемые ключи (см. документ
as_supervised):('az', 'en')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
Описание конфигурации : набор данных перевода из az_tr в en в виде обычного текста.
Размер набора данных :
42.54 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 903 |
'train' | 188 396 |
'validation' | 671 |
- Структура функции :
Translation({
'az_tr': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| az_tr | Текст | нить | ||
| en | Текст | нить |
Контролируемые ключи (см. документ
as_supervised):('az_tr', 'en')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
Описание конфигурации : набор данных перевода из be в en в виде простого текста.
Размер набора данных :
1.47 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 664 |
'train' | 4509 |
'validation' | 248 |
- Структура функции :
Translation({
'be': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| быть | Текст | нить | ||
| en | Текст | нить |
Контролируемые ключи (см.
as_superviseddoc ):('be', 'en')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_ru
Описание конфига : Перевод набора данных из be_ru в en в виде обычного текста.
Размер набора данных :
62.45 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 664 |
'train' | 212 614 |
'validation' | 248 |
- Структура функции :
Translation({
'be_ru': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| be_ru | Текст | нить | ||
| en | Текст | нить |
Контролируемые ключи (см. документ
as_supervised):('be_ru', 'en')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
Описание конфигурации : набор данных перевода из es в pt в виде обычного текста.
Размер набора данных :
9.62 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 1763 |
'train' | 44 938 |
'validation' | 1016 |
- Структура функции :
Translation({
'es': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| эс | Текст | нить | ||
| пт | Текст | нить |
Контролируемые ключи (см. документ
as_supervised):('es', 'pt')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
Описание конфигурации : набор данных перевода с fr на pt в виде простого текста.
Размер набора данных :
9.74 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 1494 |
'train' | 43 873 |
'validation' | 1131 |
- Структура функции :
Translation({
'fr': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| фр | Текст | нить | ||
| пт | Текст | нить |
Контролируемые ключи (см. документ
as_supervised):('fr', 'pt')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_en
Описание конфигурации : набор данных перевода из gl в en в виде обычного текста.
Размер набора данных :
2.41 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 1007 |
'train' | 10 017 |
'validation' | 682 |
- Структура функции :
Translation({
'en': Text(shape=(), dtype=string),
'gl': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| en | Текст | нить | ||
| гл | Текст | нить |
Контролируемые ключи (см.
as_superviseddoc ):('gl', 'en')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_en
Описание конфигурации : набор данных перевода из gl_pt в en в виде обычного текста.
Размер набора данных :
12.90 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 1007 |
'train' | 61 802 |
'validation' | 682 |
- Структура функции :
Translation({
'en': Text(shape=(), dtype=string),
'gl_pt': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| en | Текст | нить | ||
| gl_pt | Текст | нить |
Контролируемые ключи (см. документ
as_supervised):('gl_pt', 'en')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
Описание конфигурации : набор данных перевода из he в pt в виде простого текста.
Размер набора данных :
11.71 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 1623 |
'train' | 48 511 |
'validation' | 1145 |
- Структура функции :
Translation({
'he': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| он | Текст | нить | ||
| пт | Текст | нить |
Контролируемые ключи (см.
as_superviseddoc ):('he', 'pt')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
Описание конфига : Перевод датасета из него в pt в виде простого текста.
Размер набора данных :
9.94 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 1669 |
'train' | 46 259 |
'validation' | 1162 |
- Структура функции :
Translation({
'it': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| это | Текст | нить | ||
| пт | Текст | нить |
Контролируемые ключи (см.
as_superviseddoc ):('it', 'pt')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_en
Описание конфигурации : набор данных перевода из pt в en в виде обычного текста.
Размер набора данных :
10.89 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 1803 |
'train' | 51 785 |
'validation' | 1193 |
- Структура функции :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| en | Текст | нить | ||
| пт | Текст | нить |
Контролируемые ключи (см. документ
as_supervised):('pt', 'en')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_ru
Описание конфига : Набор данных перевода с ru на en в виде простого текста.
Размер набора данных :
63.22 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 5476 |
'train' | 208 106 |
'validation' | 4805 |
- Структура функции :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| en | Текст | нить | ||
| RU | Текст | нить |
Контролируемые ключи (см.
as_superviseddoc ):('ru', 'en')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
Описание конфига : Набор данных перевода с ru на pt в виде обычного текста.
Размер набора данных :
13.00 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 1588 |
'train' | 47 278 |
'validation' | 1184 |
- Структура функции :
Translation({
'pt': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| пт | Текст | нить | ||
| RU | Текст | нить |
Контролируемые ключи (см.
as_superviseddoc ):('ru', 'pt')Примеры ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_ru
Описание конфигурации : набор данных перевода из tr в en в виде простого текста.
Размер набора данных :
42.33 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 5029 |
'train' | 182 450 |
'validation' | 4045 |
- Структура функции :
Translation({
'en': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| en | Текст | нить | ||
| тр | Текст | нить |
Контролируемые ключи (см. документ
as_supervised):('tr', 'en')Примеры ( tfds.as_dataframe ):