- विवरण :
रेस 28,000 से अधिक मार्ग और लगभग 100,000 प्रश्नों के साथ बड़े पैमाने पर पढ़ने की समझ का डेटासेट है। डेटासेट चीन में अंग्रेजी परीक्षाओं से एकत्र किया गया है, जो मिडिल स्कूल और हाई स्कूल के छात्रों के लिए डिज़ाइन किए गए हैं। मशीन की समझ के लिए डेटासेट को प्रशिक्षण और परीक्षण सेट के रूप में परोसा जा सकता है।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
कॉन्फ़िगरेशन विवरण : RACE डेटासेट के लिए बिल्डर कॉन्फ़िगरेशन।
स्रोत कोड :
tfds.datasets.race.Builderसंस्करण :
-
1.0.0: प्रारंभिक रिलीज। -
2.0.0(डिफ़ॉल्ट): उदाहरण आईडी जोड़ें।
-
डाउनलोड का आकार :
24.26 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
फ़ीचर संरचना :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| जवाब | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी | |
| लेख | मूलपाठ | डोरी | ||
| example_id | मूलपाठ | डोरी | ||
| विकल्प | अनुक्रम (अनुक्रम (पाठ)) | (कोई नहीं, कोई नहीं) | डोरी | |
| प्रशन | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
दौड़/उच्च (डिफ़ॉल्ट कॉन्फ़िगरेशन)
डेटासेट का आकार :
52.39 MiBविभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'dev' | 1,021 |
'test' | 1,045 |
'train' | 18,728 |
- उदाहरण ( tfds.as_dataframe ):
दौड़/मध्य
डेटासेट का आकार :
12.51 MiBविभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- उदाहरण ( tfds.as_dataframe ):