플로레스

  • 설명 :

저자원 기계 번역을 위한 평가 데이터 세트: 네팔어-영어 및 싱할라어-영어.

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores/neen(기본 구성)

  • 구성 설명 : ne에서 en으로의 번역 데이터 세트입니다.

  • 데이터 세트 크기 : 1.89 MiB

  • 분할 :

나뉘다
'test' 2,835
'validation' 2,559
  • 기능 구조 :
Translation({
    'en': Text(shape=(), dtype=string),
    'ne': Text(shape=(), dtype=string),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
번역
ko 텍스트
텍스트

플로레스/시엔

  • 구성 설명 : si에서 en으로의 번역 데이터 세트입니다.

  • 데이터 세트 크기 : 2.05 MiB

  • 분할 :

나뉘다
'test' 2,766
'validation' 2,898
  • 기능 구조 :
Translation({
    'en': Text(shape=(), dtype=string),
    'si': Text(shape=(), dtype=string),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
번역
ko 텍스트
텍스트