- Описание :
Оценочные наборы данных для малоресурсного машинного перевода: непальский-английский и сингальский-английский.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/facebookresearch/flores/
Исходный код :
tfds.translate.FloresВерсии :
-
1.2.0(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
1.47 MiBАвтоматическое кэширование ( документация ): Да
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen (конфигурация по умолчанию)
Описание конфигурации : набор данных перевода с ne на en.
Размер набора данных :
1.89 MiB.Сплиты :
| Расколоть | Примеры |
|---|---|
'test' | 2835 |
'validation' | 2559 |
- Структура функции :
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Учебный класс | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| en | Текст | нить | ||
| пе | Текст | нить |
Контролируемые ключи (см . документ
as_supervised):('ne', 'en')Примеры ( tfds.as_dataframe ):
флорес/сиен
Описание конфигурации : набор данных перевода с si на en.
Размер набора данных :
2.05 MiB.Сплиты :
| Расколоть | Примеры |
|---|---|
'test' | 2766 |
'validation' | 2898 |
- Структура функции :
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Учебный класс | Форма | Dтип | Описание |
|---|---|---|---|---|
| Перевод | ||||
| en | Текст | нить | ||
| си | Текст | нить |
Контролируемые ключи (см.
as_superviseddoc ):('si', 'en')Примеры ( tfds.as_dataframe ):