- Mô tả :
Một bộ dữ liệu chứa 14 nghìn cuộc hội thoại với 81 nghìn cặp câu hỏi-câu trả lời. QReCC được xây dựng dựa trên các câu hỏi từ TREC CAsT, QuAC và Google Natural Questions.
Trang chủ : https://github.com/apple/ml-qrecc
Mã nguồn :
tfds.text.qrecc.QReCC
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
7.60 MiB
Kích thước tập dữ liệu :
69.29 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 16,451 |
'train' | 63,501 |
- Cấu trúc tính năng :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'answer_url': Text(shape=(), dtype=string),
'context': Sequence(Text(shape=(), dtype=string)),
'conversation_id': Scalar(shape=(), dtype=int32),
'question': Text(shape=(), dtype=string),
'question_rewrite': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'turn_id': Scalar(shape=(), dtype=int32),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
câu trả lời | Chữ | chuỗi | ||
answer_url | Chữ | chuỗi | ||
bối cảnh | Trình tự (Văn bản) | (Không có,) | chuỗi | |
cuộc hội thoại_id | Vô hướng | int32 | Id của cuộc hội thoại. | |
câu hỏi | Chữ | chuỗi | ||
question_rewrite | Chữ | chuỗi | ||
nguồn | Chữ | chuỗi | Nguồn ban đầu của dữ liệu -- QuAC, CAsT hoặc Natural Questions | |
turn_id | Vô hướng | int32 | Id của lượt hội thoại, trong một cuộc hội thoại. |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@article{qrecc,
title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
year={2021}
}