q_re_cc

  • Opis :

Zbiór danych zawierający 14 tys. rozmów z 81 tys. par pytanie-odpowiedź. QReCC opiera się na pytaniach z TREC CAST, QuAC i Google Natural Pytania.

Podział Przykłady
'test' 16 451
'train' 63501
  • Struktura funkcji :
FeaturesDict({
   
'answer': Text(shape=(), dtype=string),
   
'answer_url': Text(shape=(), dtype=string),
   
'context': Sequence(Text(shape=(), dtype=string)),
   
'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
   
'question': Text(shape=(), dtype=string),
   
'question_rewrite': Text(shape=(), dtype=string),
   
'source': Text(shape=(), dtype=string),
   
'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
odpowiedź Tekst smyczkowy
adres_odpowiedzi Tekst smyczkowy
kontekst Sekwencja (tekst) (Nic,) smyczkowy
identyfikator_rozmowy Skalarny int32 Identyfikator rozmowy.
pytanie Tekst smyczkowy
pytanie_przepisz Tekst smyczkowy
źródło Tekst smyczkowy Oryginalne źródło danych — QuAC, CAST lub Natural Pytania
turn_id Skalarny int32 Identyfikator konwersacji w trakcie rozmowy.
  • Cytat :
@article{qrecc,
  title
={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author
={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal
={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year
={2021}
}