flores
Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Bộ dữ liệu đánh giá cho bản dịch máy sử dụng ít tài nguyên: tiếng Nepal-tiếng Anh và tiếng Sinhala-tiếng Anh.
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen (cấu hình mặc định)
Tách ra | ví dụ |
---|
'test' | 2.835 |
'validation' | 2.559 |
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|
| Dịch | | | |
vi | Chữ | | sợi dây | |
ne | Chữ | | sợi dây | |
hoa/sien
Tách ra | ví dụ |
---|
'test' | 2.766 |
'validation' | 2.898 |
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|
| Dịch | | | |
vi | Chữ | | sợi dây | |
si | Chữ | | sợi dây | |
Trừ phi có lưu ý khác, nội dung của trang này được cấp phép theo Giấy phép ghi nhận tác giả 4.0 của Creative Commons và các mẫu mã lập trình được cấp phép theo Giấy phép Apache 2.0. Để biết thông tin chi tiết, vui lòng tham khảo Chính sách trang web của Google Developers. Java là nhãn hiệu đã đăng ký của Oracle và/hoặc các đơn vị liên kết với Oracle.
Cập nhật lần gần đây nhất: 2022-12-06 UTC.
[null,null,["Cập nhật lần gần đây nhất: 2022-12-06 UTC."],[],[],null,["# flores\n\n\u003cbr /\u003e\n\n- **Description**:\n\nEvaluation datasets for low-resource machine translation: Nepali-English and\nSinhala-English.\n\n- **Additional Documentation** :\n [Explore on Papers With Code\n north_east](https://paperswithcode.com/dataset/flores)\n\n- **Homepage** :\n \u003chttps://github.com/facebookresearch/flores/\u003e\n\n- **Source code** :\n [`tfds.translate.Flores`](https://github.com/tensorflow/datasets/tree/master/tensorflow_datasets/translate/flores.py)\n\n- **Versions**:\n\n - **`1.2.0`** (default): No release notes.\n- **Download size** : `1.47 MiB`\n\n- **Auto-cached**\n ([documentation](https://www.tensorflow.org/datasets/performances#auto-caching)):\n Yes\n\n- **Figure**\n ([tfds.show_examples](https://www.tensorflow.org/datasets/api_docs/python/tfds/visualization/show_examples)):\n Not supported.\n\n- **Citation**:\n\n @misc{guzmn2019new,\n title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},\n author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},\n year={2019},\n eprint={1902.01382},\n archivePrefix={arXiv},\n primaryClass={cs.CL}\n }\n\nflores/neen (default config)\n----------------------------\n\n- **Config description**: Translation dataset from ne to en.\n\n- **Dataset size** : `1.89 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------------|----------|\n| `'test'` | 2,835 |\n| `'validation'` | 2,559 |\n\n- **Feature structure**:\n\n Translation({\n 'en': Text(shape=(), dtype=string),\n 'ne': Text(shape=(), dtype=string),\n })\n\n- **Feature documentation**:\n\n| Feature | Class | Shape | Dtype | Description |\n|---------|-------------|-------|--------|-------------|\n| | Translation | | | |\n| en | Text | | string | |\n| ne | Text | | string | |\n\n- **Supervised keys** (See\n [`as_supervised` doc](https://www.tensorflow.org/datasets/api_docs/python/tfds/load#args)):\n `('ne', 'en')`\n\n- **Examples**\n ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples... \n\nflores/sien\n-----------\n\n- **Config description**: Translation dataset from si to en.\n\n- **Dataset size** : `2.05 MiB`\n\n- **Splits**:\n\n| Split | Examples |\n|----------------|----------|\n| `'test'` | 2,766 |\n| `'validation'` | 2,898 |\n\n- **Feature structure**:\n\n Translation({\n 'en': Text(shape=(), dtype=string),\n 'si': Text(shape=(), dtype=string),\n })\n\n- **Feature documentation**:\n\n| Feature | Class | Shape | Dtype | Description |\n|---------|-------------|-------|--------|-------------|\n| | Translation | | | |\n| en | Text | | string | |\n| si | Text | | string | |\n\n- **Supervised keys** (See\n [`as_supervised` doc](https://www.tensorflow.org/datasets/api_docs/python/tfds/load#args)):\n `('si', 'en')`\n\n- **Examples**\n ([tfds.as_dataframe](https://www.tensorflow.org/datasets/api_docs/python/tfds/as_dataframe)):\n\nDisplay examples..."]]