گل ها

  • توضیحات :

مجموعه داده‌های ارزیابی برای ترجمه ماشینی با منابع کم: نپالی-انگلیسی و سینهالی-انگلیسی.

@misc{guzmn2019new,
    title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
    author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
    year={2019},
    eprint={1902.01382},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

flores/neen (پیکربندی پیش فرض)

  • توضیحات پیکربندی : مجموعه داده های ترجمه از ne به en.

  • حجم مجموعه داده : 1.89 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 2,835
'validation' 2,559
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'ne': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
ne متن رشته

flores/sien

  • توضیحات پیکربندی : مجموعه داده های ترجمه از si به en.

  • حجم مجموعه داده : 2.05 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 2766
'validation' 2,898
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'si': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
سی متن رشته