जाति

  • विवरण :

रेस 28,000 से अधिक मार्ग और लगभग 100,000 प्रश्नों के साथ बड़े पैमाने पर पढ़ने की समझ का डेटासेट है। डेटासेट चीन में अंग्रेजी परीक्षाओं से एकत्र किया गया है, जो मिडिल स्कूल और हाई स्कूल के छात्रों के लिए डिज़ाइन किए गए हैं। मशीन की समझ के लिए डेटासेट को प्रशिक्षण और परीक्षण सेट के रूप में परोसा जा सकता है।

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
जवाब अनुक्रम (पाठ) (कोई भी नहीं,) डोरी
लेख मूलपाठ डोरी
example_id मूलपाठ डोरी
विकल्प अनुक्रम (अनुक्रम (पाठ)) (कोई नहीं, कोई नहीं) डोरी
प्रशन अनुक्रम (पाठ) (कोई भी नहीं,) डोरी
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

दौड़/उच्च (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • डेटासेट का आकार : 52.39 MiB

  • विभाजन :

विभाजित करना उदाहरण
'dev' 1,021
'test' 1,045
'train' 18,728

दौड़/मध्य

  • डेटासेट का आकार : 12.51 MiB

  • विभाजन :

विभाजित करना उदाहरण
'dev' 368
'test' 362
'train' 6,409