mlqa

Mô tả :

MLQA (Bộ dữ liệu trả lời câu hỏi đa ngôn ngữ) là bộ dữ liệu chuẩn để đánh giá hiệu suất trả lời câu hỏi đa ngôn ngữ. Bộ dữ liệu bao gồm 7 ngôn ngữ: Ả Rập, Đức, Tây Ban Nha, Anh, Hindi, Việt Nam, Trung Quốc.

Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://github.com/facebookresearch/MLQA
Mã nguồn : tfds.datasets.mlqa.Builder
Phiên bản :
- 1.0.0 (mặc định): Không có ghi chú phát hành.
Kích thước tải xuống : 72.21 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Cấu trúc tính năng :

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})

Tài liệu tính năng :

Tính năng	Lớp học	Dtype
	Tính năngDict
câu trả lời	Sự liên tiếp
câu trả lời/answer_start	tenxơ	int32
câu trả lời/văn bản	Chữ	sợi dây
bối cảnh	Chữ	sợi dây
nhận dạng	tenxơ	sợi dây
câu hỏi	Chữ	sợi dây
tiêu đề	Chữ	sợi dây

Các khóa được giám sát (Xem as_supervised doc ): None
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :

@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (cấu hình mặc định)

Mô tả cấu hình : Phân tách thử nghiệm và phát triển MLQA 'ar'.
Kích thước tập dữ liệu : 9.28 MiB
Chia tách :

Tách ra	ví dụ
`'test'`	5,335
`'validation'`	517

Ví dụ ( tfds.as_dataframe ):

mlqa/de

Mô tả cấu hình : MLQA 'de' dev và test splits.
Kích thước tập dữ liệu : 5.06 MiB
Chia tách :

Tách ra	ví dụ
`'test'`	4,517
`'validation'`	512

Ví dụ ( tfds.as_dataframe ):

mlqa/vi

Mô tả cấu hình : MLQA 'en' dev và test splits.
Kích thước tập dữ liệu : 15.72 MiB
Chia tách :

Tách ra	ví dụ
`'test'`	11.590
`'validation'`	1.148

Ví dụ ( tfds.as_dataframe ):

mlqa/es

Mô tả cấu hình : Các phần tách thử nghiệm và phát triển của MLQA 'es'.
Kích thước tập dữ liệu : 5.09 MiB
Chia tách :

Tách ra	ví dụ
`'test'`	5,253
`'validation'`	500

Ví dụ ( tfds.as_dataframe ):

mlqa/hi

Mô tả cấu hình : MLQA 'hi' dev và test splits.
Kích thước tập dữ liệu : 12.83 MiB
Chia tách :

Tách ra	ví dụ
`'test'`	4.918
`'validation'`	507

Ví dụ ( tfds.as_dataframe ):

mlqa/vi

Mô tả cấu hình : Phân tách thử nghiệm và phát triển 'vi' của MLQA.
Kích thước tập dữ liệu : 8.77 MiB
Chia tách :

Tách ra	ví dụ
`'test'`	5,495
`'validation'`	511

Ví dụ ( tfds.as_dataframe ):

mlqa/zh

Mô tả cấu hình : Phân tách thử nghiệm và phát triển MLQA 'zh'.
Kích thước tập dữ liệu : 5.13 MiB
Chia tách :

Tách ra	ví dụ
`'test'`	5,137
`'validation'`	504

Ví dụ ( tfds.as_dataframe ):

mlqa Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.

mlqa/ar (cấu hình mặc định)

mlqa/de

mlqa/vi

mlqa/es

mlqa/hi

mlqa/vi

mlqa/zh

mlqa