- توضیحات :
مجموعه داده ای حاوی 14 هزار مکالمه با 81 هزار جفت پرسش و پاسخ. QReCC بر اساس سوالات TREC CAsT، QuAC و Google Natural Questions ساخته شده است.
صفحه اصلی : https://github.com/apple/ml-qrecc
کد منبع :
tfds.text.qrecc.QReCC
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
حجم دانلود :
7.60 MiB
حجم مجموعه داده :
69.29 MiB
ذخیره خودکار ( اسناد ): بله
تقسیمات :
تقسیم کنید | نمونه ها |
---|---|
'test' | 16,451 |
'train' | 63,501 |
- ساختار ویژگی :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'answer_url': Text(shape=(), dtype=string),
'context': Sequence(Text(shape=(), dtype=string)),
'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
'question': Text(shape=(), dtype=string),
'question_rewrite': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | توضیحات |
---|---|---|---|---|
FeaturesDict | ||||
پاسخ دهید | متن | رشته | ||
answer_url | متن | رشته | ||
زمینه | دنباله (متن) | (هیچ،) | رشته | |
گفتگو_id | اسکالر | int32 | شناسه مکالمه | |
سوال | متن | رشته | ||
سوال_بازنویسی | متن | رشته | ||
منبع | متن | رشته | منبع اصلی داده ها - QuAC، CAsT یا Natural Questions | |
turn_id | اسکالر | int32 | شناسه مکالمه در یک مکالمه تبدیل می شود. |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@article{qrecc,
title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
year={2021}
}