दस्ते_सवाल_पीढ़ी

  • विवरण :

'न्यूरल क्वेश्चन जनरेशन फ्रॉम टेक्स्ट: ए प्रिलिमिनरी स्टडी' (झोउ एट अल, 2017) और 'लर्निंग टू आस्क: न्यूरल क्वेश्चन जेनरेशन फॉर रीडिंग कॉम्प्रिहेंशन' (ड्यू एट अल, 2017) में वर्णित डेटा स्प्लिट्स का उपयोग करके स्क्वाड डेटासेट का उपयोग करके प्रश्न बनाना।

@inproceedings{du-etal-2017-learning,
    title = "Learning to Ask: Neural Question Generation for Reading Comprehension",
    author = "Du, Xinya  and Shao, Junru  and Cardie, Claire",
    booktitle = "Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = jul,
    year = "2017",
    address = "Vancouver, Canada",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/P17-1123",
    doi = "10.18653/v1/P17-1123",
    pages = "1342--1352",
}

@inproceedings{rajpurkar-etal-2016-squad,
    title = "{SQ}u{AD}: 100,000+ Questions for Machine Comprehension of Text",
    author = "Rajpurkar, Pranav  and Zhang, Jian  and Lopyrev, Konstantin  and Liang, Percy",
    booktitle = "Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2016",
    address = "Austin, Texas",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D16-1264",
    doi = "10.18653/v1/D16-1264",
    pages = "2383--2392",
}

स्क्वाड_क्वेश्चन_जेनरेशन/स्प्लिट_डु (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फिग विवरण : पैसेज-स्तर के संदर्भों से स्वतंत्र प्रश्न निर्माण का उत्तर दें (ड्यू एट अल, 2017)।

  • डाउनलोड आकार : 62.83 MiB

  • डेटासेट का आकार : 84.67 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 11,877
'train' 75,722
'validation' 10,570
  • फ़ीचर संरचना :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'context_passage': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
उत्तर मूलपाठ डोरी
context_passage मूलपाठ डोरी
प्रश्न मूलपाठ डोरी

स्क्वाड_क्वेश्चन_जेनरेशन/स्प्लिट_झोउ

  • कॉन्फिग विवरण : वाक्य- और पैसेज-स्तर के संदर्भों से उत्तर-अवधि निर्भर प्रश्न पीढ़ी (झोउ एट अल, 2017)।

  • डाउनलोड आकार : 62.52 MiB

  • डेटासेट का आकार : 111.02 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 8,964
'train' 86,635
'validation' 8,965
  • फ़ीचर संरचना :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'context_passage': Text(shape=(), dtype=string),
    'context_sentence': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
उत्तर मूलपाठ डोरी
context_passage मूलपाठ डोरी
संदर्भ_वाक्य मूलपाठ डोरी
प्रश्न मूलपाठ डोरी