- Mô tả :
MLQA (Bộ dữ liệu trả lời câu hỏi đa ngôn ngữ) là bộ dữ liệu chuẩn để đánh giá hiệu suất trả lời câu hỏi đa ngôn ngữ. Bộ dữ liệu bao gồm 7 ngôn ngữ: Ả Rập, Đức, Tây Ban Nha, Anh, Hindi, Việt Nam, Trung Quốc.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://github.com/facebookresearch/MLQA
Mã nguồn :
tfds.datasets.mlqa.Builder
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
72.21 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Cấu trúc tính năng :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
câu trả lời | Sự liên tiếp | |||
câu trả lời/answer_start | tenxơ | int32 | ||
câu trả lời/văn bản | Chữ | sợi dây | ||
bối cảnh | Chữ | sợi dây | ||
nhận dạng | tenxơ | sợi dây | ||
câu hỏi | Chữ | sợi dây | ||
tiêu đề | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (cấu hình mặc định)
Mô tả cấu hình : Phân tách thử nghiệm và phát triển MLQA 'ar'.
Kích thước tập dữ liệu :
9.28 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 5,335 |
'validation' | 517 |
- Ví dụ ( tfds.as_dataframe ):
mlqa/de
Mô tả cấu hình : MLQA 'de' dev và test splits.
Kích thước tập dữ liệu :
5.06 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 4,517 |
'validation' | 512 |
- Ví dụ ( tfds.as_dataframe ):
mlqa/vi
Mô tả cấu hình : MLQA 'en' dev và test splits.
Kích thước tập dữ liệu :
15.72 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 11.590 |
'validation' | 1.148 |
- Ví dụ ( tfds.as_dataframe ):
mlqa/es
Mô tả cấu hình : Các phần tách thử nghiệm và phát triển của MLQA 'es'.
Kích thước tập dữ liệu :
5.09 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 5,253 |
'validation' | 500 |
- Ví dụ ( tfds.as_dataframe ):
mlqa/hi
Mô tả cấu hình : MLQA 'hi' dev và test splits.
Kích thước tập dữ liệu :
12.83 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 4.918 |
'validation' | 507 |
- Ví dụ ( tfds.as_dataframe ):
mlqa/vi
Mô tả cấu hình : Phân tách thử nghiệm và phát triển 'vi' của MLQA.
Kích thước tập dữ liệu :
8.77 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 5,495 |
'validation' | 511 |
- Ví dụ ( tfds.as_dataframe ):
mlqa/zh
Mô tả cấu hình : Phân tách thử nghiệm và phát triển MLQA 'zh'.
Kích thước tập dữ liệu :
5.13 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 5,137 |
'validation' | 504 |
- Ví dụ ( tfds.as_dataframe ):