- 설명 :
저자원 기계 번역을 위한 평가 데이터 세트: 네팔어-영어 및 싱할라어-영어.
소스 코드 :
tfds.translate.Flores
버전 :
-
1.2.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
1.47 MiB
자동 캐시 ( 문서 ): 예
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen(기본 구성)
구성 설명 : ne에서 en으로의 번역 데이터 세트입니다.
데이터 세트 크기 :
1.89 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 2,835 |
'validation' | 2,559 |
- 기능 구조 :
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
ko | 텍스트 | 끈 | ||
네 | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):('ne', 'en')
예 ( tfds.as_dataframe ):
플로레스/시엔
구성 설명 : si에서 en으로의 번역 데이터 세트입니다.
데이터 세트 크기 :
2.05 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 2,766 |
'validation' | 2,898 |
- 기능 구조 :
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
번역 | ||||
ko | 텍스트 | 끈 | ||
시 | 텍스트 | 끈 |
감독 키 (
as_supervised
문서 참조):('si', 'en')
예 ( tfds.as_dataframe ):