- Mô tả :
Bộ dữ liệu tương đương câu trả lời chứa xếp hạng của con người về các dự đoán mô hình từ một số mô hình trên bộ dữ liệu SQuAD. Xếp hạng xác định xem câu trả lời dự đoán có 'tương đương' với câu trả lời vàng hay không (có tính đến cả câu hỏi và ngữ cảnh).
Cụ thể hơn, 'tương đương' có nghĩa là câu trả lời dự đoán chứa ít nhất thông tin giống như câu trả lời vàng và không thêm thông tin thừa. Bộ dữ liệu chứa các chú thích cho: * dự đoán từ BiDAF trên nhà phát triển SQuAD * dự đoán từ XLNet trên nhà phát triển SQuAD * dự đoán từ Luke trên nhà phát triển SQuAD * dự đoán từ Albert về các ví dụ đào tạo, nhà phát triển và thử nghiệm SQuAD
Trang chủ : https://github.com/google-research-datasets/answer-equivalence-dataset
Mã nguồn :
tfds.datasets.answer_equivalence.Builder
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
45.86 MiB
Kích thước tập dữ liệu :
47.24 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'ae_dev' | 4,446 |
'ae_test' | 9,724 |
'dev_bidaf' | 7,522 |
'dev_luke' | 4.590 |
'dev_xlnet' | 7,932 |
'train' | 9.090 |
- Cấu trúc tính năng :
FeaturesDict({
'candidate': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'gold_index': int32,
'qid': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
'reference': Text(shape=(), dtype=string),
'score': float32,
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
ứng viên | Chữ | sợi dây | ||
định nghĩa bài văn | Chữ | sợi dây | ||
gold_index | tenxơ | int32 | ||
qid | Chữ | sợi dây | ||
câu hỏi | Chữ | sợi dây | ||
câu hỏi 1 | LớpNhãn | int64 | ||
Câu hỏi 2 | LớpNhãn | int64 | ||
câu hỏi_3 | LớpNhãn | int64 | ||
câu hỏi_4 | LớpNhãn | int64 | ||
tài liệu tham khảo | Chữ | sợi dây | ||
ghi bàn | tenxơ | phao32 |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@article{bulian-etal-2022-tomayto,
title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
year={2022},
eprint={2202.07654},
archivePrefix={arXiv},
primaryClass={cs.CL}
}