- คำอธิบาย :
งาน NQ-Open นำเสนอโดย Lee et.al 2019 เป็นมาตรฐานการตอบคำถามโดเมนแบบเปิดที่ได้มาจากคำถามธรรมชาติ เป้าหมายคือการคาดเดาสตริงคำตอบภาษาอังกฤษสำหรับคำถามภาษาอังกฤษที่ป้อน คำถามทั้งหมดสามารถตอบได้โดยใช้เนื้อหาของวิกิพีเดียภาษาอังกฤษ
หน้าแรก : https://github.com/google-research-datasets/natural-questions/tree/master/nq_open
ซอร์สโค้ด :
tfds.datasets.natural_questions_open.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
8.50 MiB
ขนาดชุดข้อมูล :
8.70 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 87,925 |
'validation' | 3,610 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'answer': Sequence(string),
'question': string,
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
คำตอบ | ลำดับ (เทนเซอร์) | (ไม่มี,) | สตริง | |
คำถาม | เทนเซอร์ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@inproceedings{orqa,
title = {Latent Retrieval for Weakly Supervised Open Domain Question Answering},
author = {Lee, Kenton and Chang, Ming-Wei and Toutanova, Kristina},
year = {2019},
month = {01},
pages = {6086-6096},
booktitle = {Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
doi = {10.18653/v1/P19-1612}
}
@article{47761,
title = {Natural Questions: a Benchmark for Question Answering Research},
author = {Tom Kwiatkowski and Jennimaria Palomaki and Olivia Redfield and Michael Collins and Ankur Parikh and Chris Alberti and Danielle Epstein and Illia Polosukhin and Matthew Kelcey and Jacob Devlin and Kenton Lee and Kristina N. Toutanova and Llion Jones and Ming-Wei Chang and Andrew Dai and Jakob Uszkoreit and Quoc Le and Slav Petrov},
year = {2019},
journal = {Transactions of the Association of Computational Linguistics}
}