quac

  • คำอธิบาย :

การตอบคำถามในบริบทเป็นชุดข้อมูลสำหรับสร้างแบบจำลอง ทำความเข้าใจ และเข้าร่วมในกล่องโต้ตอบการหาข้อมูล อินสแตนซ์ข้อมูลประกอบด้วยบทสนทนาโต้ตอบระหว่างคนทำงานกลุ่มสองคน: (1) นักเรียนที่ถามคำถามรูปแบบอิสระตามลำดับเพื่อเรียนรู้ให้มากที่สุดเท่าที่จะเป็นไปได้เกี่ยวกับข้อความ Wikipedia ที่ซ่อนอยู่ และ (2) ครูที่ตอบคำถามโดยให้ข้อความที่ตัดตอนมาสั้นๆ (ช่วง) จากข้อความ QuAC นำเสนอความท้าทายที่ไม่พบในชุดข้อมูลความเข้าใจของเครื่องจักรที่มีอยู่: คำถามของมันมักจะเป็นคำถามปลายเปิด ไม่มีคำตอบ หรือมีความหมายเฉพาะในบริบทการสนทนาเท่านั้น

แยก ตัวอย่าง
'train' 83,568
'validation' 7,354
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'background': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'followup': Text(shape=(), dtype=string),
    'orig_answer': FeaturesDict({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'question': Text(shape=(), dtype=string),
    'section_title': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'yesno': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
คำตอบ ลำดับ
คำตอบ/answer_start เทนเซอร์ int32
คำตอบ/ข้อความ ข้อความ สตริง
พื้นหลัง ข้อความ สตริง
บริบท ข้อความ สตริง
ติดตาม ข้อความ สตริง
orig_answer คุณสมบัติDict
orig_answer/answer_start เทนเซอร์ int32
orig_answer/ข้อความ ข้อความ สตริง
คำถาม ข้อความ สตริง
section_title ข้อความ สตริง
ชื่อ ข้อความ สตริง
ใช่ไม่ใช่ ข้อความ สตริง
  • การอ้างอิง :
@article{choi2018quac,
  title={Quac: Question answering in context},
  author={Choi, Eunsol and He, He and Iyyer, Mohit and Yatskar, Mark and Yih, Wen-tau and Choi, Yejin and Liang, Percy and Zettlemoyer, Luke},
  journal={arXiv preprint arXiv:1808.07036},
  year={2018}
}