answer_equivalence

Mô tả :

Bộ dữ liệu tương đương câu trả lời chứa xếp hạng của con người về các dự đoán mô hình từ một số mô hình trên bộ dữ liệu SQuAD. Xếp hạng xác định xem câu trả lời dự đoán có 'tương đương' với câu trả lời vàng hay không (có tính đến cả câu hỏi và ngữ cảnh).

Cụ thể hơn, 'tương đương' có nghĩa là câu trả lời dự đoán chứa ít nhất thông tin giống như câu trả lời vàng và không thêm thông tin thừa. Bộ dữ liệu chứa các chú thích cho: * dự đoán từ BiDAF trên nhà phát triển SQuAD * dự đoán từ XLNet trên nhà phát triển SQuAD * dự đoán từ Luke trên nhà phát triển SQuAD * dự đoán từ Albert về các ví dụ đào tạo, nhà phát triển và thử nghiệm SQuAD

Trang chủ : https://github.com/google-research-datasets/answer-equivalence-dataset
Mã nguồn : tfds.datasets.answer_equivalence.Builder
Phiên bản :
- 1.0.0 (mặc định): Bản phát hành đầu tiên.
Kích thước tải xuống : 45.86 MiB
Kích thước tập dữ liệu : 47.24 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :

Tách ra	ví dụ
`'ae_dev'`	4,446
`'ae_test'`	9,724
`'dev_bidaf'`	7,522
`'dev_luke'`	4.590
`'dev_xlnet'`	7,932
`'train'`	9.090

Cấu trúc tính năng :

FeaturesDict({
    'candidate': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'gold_index': int32,
    'qid': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
    'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'reference': Text(shape=(), dtype=string),
    'score': float32,
})

Tài liệu tính năng :

Tính năng	Lớp	Dtype
	Tính năngDict
ứng viên	Chữ	sợi dây
định nghĩa bài văn	Chữ	sợi dây
gold_index	tenxơ	int32
qid	Chữ	sợi dây
câu hỏi	Chữ	sợi dây
câu hỏi 1	LớpNhãn	int64
Câu hỏi 2	LớpNhãn	int64
câu hỏi_3	LớpNhãn	int64
câu hỏi_4	LớpNhãn	int64
tài liệu tham khảo	Chữ	sợi dây
ghi bàn	tenxơ	phao32

Các khóa được giám sát (Xem as_supervised doc ): None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):

trích dẫn :

@article{bulian-etal-2022-tomayto,
      title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
      author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
      year={2022},
      eprint={2202.07654},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}