दस्ता

  • विवरण :

स्टैनफोर्ड क्वेश्चन आंसरिंग डेटासेट (SQuAD) एक रीडिंग कॉम्प्रिहेंशन डेटासेट है, जिसमें विकिपीडिया लेखों के एक सेट पर क्राउडवर्कर्स द्वारा पूछे गए प्रश्न शामिल हैं, जहाँ हर प्रश्न का उत्तर पाठ का एक खंड है, या स्पैन, संबंधित पठन मार्ग से, या प्रश्न अनुत्तरित हो सकता है।

@article{2016arXiv160605250R,
       author
= { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
                 
Konstantin and {Liang}, Percy},
        title
= "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
      journal
= {arXiv e-prints},
         year
= 2016,
          eid
= {arXiv:1606.05250},
        pages
= {arXiv:1606.05250},
archivePrefix
= {arXiv},
       eprint
= {1606.05250},
}

स्क्वाड/v1.1 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िगरेशन विवरण : SQUAD का संस्करण 1.1.0

  • डाउनलोड आकार : 33.51 MiB

  • डेटासेट का आकार : 94.06 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ

  • विभाजन :

विभाजित करना उदाहरण
'train' 87,599
'validation' 10,570
  • फ़ीचर संरचना :
FeaturesDict({
   
'answers': Sequence({
       
'answer_start': int32,
       
'text': Text(shape=(), dtype=string),
   
}),
   
'context': Text(shape=(), dtype=string),
   
'id': string,
   
'question': Text(shape=(), dtype=string),
   
'title': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
जवाब अनुक्रम
उत्तर/जवाब_शुरू टेन्सर int32
उत्तर/पाठ लेख डोरी
प्रसंग लेख डोरी
पहचान टेन्सर डोरी
सवाल लेख डोरी
शीर्षक लेख डोरी

दस्ते/v2.0

  • कॉन्फ़िगरेशन विवरण : SQUAD का संस्करण 2.0.0

  • डाउनलोड का आकार : 44.34 MiB

  • डेटासेट का आकार : 148.54 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ (सत्यापन), केवल जब shuffle_files=False (ट्रेन)

  • विभाजन :

विभाजित करना उदाहरण
'train' 130,319
'validation' 11,873
  • फ़ीचर संरचना :
FeaturesDict({
   
'answers': Sequence({
       
'answer_start': int32,
       
'text': Text(shape=(), dtype=string),
   
}),
   
'context': Text(shape=(), dtype=string),
   
'id': string,
   
'is_impossible': bool,
   
'plausible_answers': Sequence({
       
'answer_start': int32,
       
'text': Text(shape=(), dtype=string),
   
}),
   
'question': Text(shape=(), dtype=string),
   
'title': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
जवाब अनुक्रम
उत्तर/जवाब_शुरू टेन्सर int32
उत्तर/पाठ लेख डोरी
प्रसंग लेख डोरी
पहचान टेन्सर डोरी
असंभव है टेन्सर बूल
प्रशंसनीय_जवाब अनुक्रम
प्रशंसनीय_उत्तर/उत्तर_प्रारंभ टेन्सर int32
प्रशंसनीय_उत्तर/पाठ लेख डोरी
सवाल लेख डोरी
शीर्षक लेख डोरी