ยางลบ_multi_rc

  • คำอธิบาย :

Eraser Multi RC เป็นชุดข้อมูลสำหรับการสืบค้นข้อความหลายบรรทัด พร้อมด้วยคำตอบและเหตุผล แต่ละตัวอย่างในชุดข้อมูลนี้มี 5 ส่วนดังต่อไปนี้

  1. A Mutli-line Passage 2. คำถามเกี่ยวกับเนื้อเรื่อง 3. คำตอบสำหรับคำถาม
  2. ก. การจำแนกว่าคำตอบถูกหรือผิด 5. คำอธิบายที่สมควรแก่การจำแนก
แยก ตัวอย่าง
'test' 4,848
'train' 24,029
'validation' 3,214
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'evidences': Sequence(Text(shape=(), dtype=string)),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'passage': Text(shape=(), dtype=string),
    'query_and_answer': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
หลักฐาน ลำดับ (ข้อความ) (ไม่มี,) สตริง
ฉลาก ป้ายกำกับคลาส int64
ทางเดิน ข้อความ สตริง
แบบสอบถาม_และ_คำตอบ ข้อความ สตริง
  • การอ้างอิง :
@unpublished{eraser2019,
    title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
    author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
    author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
    title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
    booktitle = {NAACL},
    year = {2018}
}