- תיאור :
מערך הנתונים של HellaSwag הוא אמת מידה עבור Commonsense NLI. הוא כולל הקשר וכמה סיומים המשלימים את ההקשר.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://rowanzellers.com/hellaswag/
קוד מקור :
tfds.text.Hellaswag
גרסאות :
-
0.0.1
: אין הערות שחרור. -
1.0.0
: הוספת פיצולים נפרדים עבור ערכות אימות/בדיקה בתוך הדומיין ומחוץ לדומיין. -
1.1.0
(ברירת מחדל): עוד ממד מפוצל למקור (wikihow לעומת Activitynet)
-
גודל הורדה :
68.18 MiB
גודל ערכת נתונים:
107.45 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 10,003 |
'test_ind_activitynet' | 1,870 |
'test_ind_wikihow' | 3,132 |
'test_ood_activitynet' | 1,651 |
'test_ood_wikihow' | 3,350 |
'train' | 39,905 |
'train_activitynet' | 14,740 |
'train_wikihow' | 25,165 |
'validation' | 10,042 |
'validation_ind_activitynet' | 1,809 |
'validation_ind_wikihow' | 3,192 |
'validation_ood_activitynet' | 1,434 |
'validation_ood_wikihow' | 3,607 |
- מבנה תכונה :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תווית_פעילות | טֶקסט | חוּט | ||
הֶקשֵׁר | טֶקסט | חוּט | ||
סיומים | רצף (טקסט) | (אף אחד,) | חוּט | |
תווית | מוֹתֵחַ | int32 | ||
מזהה_מקור | טֶקסט | חוּט | ||
split_type | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}