q_re_cc

  • Tanım :

81 bin soru-cevap çifti ile 14 bin görüşme içeren bir veri kümesi. QReCC, TREC CAsT, QuAC ve Google Natural Questions'ın soruları üzerine kurulmuştur.

Bölmek Örnekler
'test' 16.451
'train' 63.501
  • Özellik yapısı :
FeaturesDict({
   
'answer': Text(shape=(), dtype=string),
   
'answer_url': Text(shape=(), dtype=string),
   
'context': Sequence(Text(shape=(), dtype=string)),
   
'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
   
'question': Text(shape=(), dtype=string),
   
'question_rewrite': Text(shape=(), dtype=string),
   
'source': Text(shape=(), dtype=string),
   
'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
cevap Metin sicim
answer_url Metin sicim
bağlam Sıra(Metin) (Hiçbiri,) sicim
konuşma_kimliği Skaler int32 Konuşmanın kimliği.
soru Metin sicim
soru_yeniden yazma Metin sicim
kaynak Metin sicim Verilerin orijinal kaynağı - QuAC, CAsT veya Natural Questions
dönüş_id Skaler int32 Konuşmanın kimliği bir konuşma içinde değişir.
  • Alıntı :
@article{qrecc,
  title
={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author
={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal
={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year
={2021}
}