جيل_السؤال

  • الوصف :

إنشاء الأسئلة باستخدام مجموعة بيانات الفريق باستخدام تقسيمات البيانات الموضحة في "إنشاء الأسئلة العصبية من النص: دراسة أولية" (Zhou et al ، 2017) و "تعلم طرح السؤال: توليد الأسئلة العصبية لفهم القراءة" (Du et al ، 2017).

@inproceedings{du-etal-2017-learning,
    title = "Learning to Ask: Neural Question Generation for Reading Comprehension",
    author = "Du, Xinya  and Shao, Junru  and Cardie, Claire",
    booktitle = "Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = jul,
    year = "2017",
    address = "Vancouver, Canada",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/P17-1123",
    doi = "10.18653/v1/P17-1123",
    pages = "1342--1352",
}

@inproceedings{rajpurkar-etal-2016-squad,
    title = "{SQ}u{AD}: 100,000+ Questions for Machine Comprehension of Text",
    author = "Rajpurkar, Pranav  and Zhang, Jian  and Lopyrev, Konstantin  and Liang, Percy",
    booktitle = "Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2016",
    address = "Austin, Texas",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D16-1264",
    doi = "10.18653/v1/D16-1264",
    pages = "2383--2392",
}

squad_question_generation / split_du (التكوين الافتراضي)

  • وصف التكوين : أجب عن إنشاء سؤال مستقل من سياقات على مستوى المرور (Du et al ، 2017).

  • حجم التحميل : 62.83 MiB

  • حجم مجموعة البيانات : 84.67 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 11،877
'train' 75722
'validation' 10570
  • هيكل الميزة :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'context_passage': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
إجابه نص سلسلة
سياق_مرور نص سلسلة
سؤال نص سلسلة

squad_question_generation / split_zhou

  • وصف التكوين : إنشاء أسئلة تعتمد على مدى الإجابة من سياقات على مستوى الجملة والمرور (Zhou et al ، 2017).

  • حجم التحميل : 62.52 MiB

  • حجم مجموعة البيانات : 111.02 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 8964
'train' 86،635
'validation' 8965
  • هيكل الميزة :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'context_passage': Text(shape=(), dtype=string),
    'context_sentence': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
إجابه نص سلسلة
سياق_مرور نص سلسلة
سياق_الجواب نص سلسلة
سؤال نص سلسلة