- विवरण :
MC-TACO 13k प्रश्न-उत्तर युग्मों का एक डेटासेट है जिसके लिए अस्थायी सामान्य ज्ञान की समझ की आवश्यकता होती है। डेटासेट में पाँच अस्थायी गुण होते हैं:
- अवधि (एक घटना में कितना समय लगता है)
- अस्थायी क्रम (घटनाओं का विशिष्ट क्रम)
- विशिष्ट समय (जब कोई घटना होती है)
- आवृत्ति (कितनी बार कोई घटना होती है)
- स्थिरता (चाहे कोई राज्य बहुत लंबे समय तक या अनिश्चित काल तक बना रहे)
हम आशा करते हैं कि यह डेटासेट तर्क समस्याओं के इस विशेष वर्ग के भविष्य के अन्वेषण को बढ़ावा दे सकता है।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : https://github.com/CogComp/MCTACO
स्रोत कोड :
tfds.datasets.mctaco.Builderसंस्करण :
-
1.0.0(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
2.27 MiBडेटासेट का आकार :
3.18 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'test' | 9,442 |
'validation' | 3,783 |
- फ़ीचर संरचना :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| उत्तर | मूलपाठ | डोरी | ||
| वर्ग | क्लासलेबल | int64 | ||
| लेबल | क्लासलेबल | int64 | ||
| सवाल | मूलपाठ | डोरी | ||
| वाक्य | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}