- תיאור :
MC-TACO הוא מערך נתונים של 13,000 צמדי שאלות ותשובות הדורשים הבנה זמנית של שכל. מערך הנתונים מכיל חמישה מאפיינים זמניים:
- משך (כמה זמן לוקח אירוע)
- סדר זמני (סדר אופייני של אירועים)
- זמן טיפוסי (כאשר מתרחש אירוע)
- תדירות (באיזו תדירות מתרחש אירוע)
- נייחות (בין אם מצב נשמר במשך זמן רב מאוד או ללא הגבלת זמן)
אנו מקווים שמערך נתונים זה יכול לקדם את החקירה העתידית של סוג זה של בעיות חשיבה ספציפיות.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/CogComp/MCTACO
קוד מקור :
tfds.datasets.mctaco.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
2.27 MiB
גודל מערך נתונים :
3.18 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 9,442 |
'validation' | 3,783 |
- מבנה תכונה :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תשובה | טֶקסט | חוּט | ||
קטגוריה | ClassLabel | int64 | ||
תווית | ClassLabel | int64 | ||
שְׁאֵלָה | טֶקסט | חוּט | ||
משפט | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}