hellaswag

  • תיאור :

מערך הנתונים של HellaSwag הוא אמת מידה עבור Commonsense NLI. הוא כולל הקשר וכמה סיומים המשלימים את ההקשר.

  • תיעוד נוסף : חקור על ניירות עם קוד

  • דף הבית : https://rowanzellers.com/hellaswag/

  • קוד מקור : tfds.text.Hellaswag

  • גרסאות :

    • 0.0.1 : אין הערות שחרור.
    • 1.0.0 : הוספת פיצולים נפרדים עבור ערכות אימות/בדיקה בתוך הדומיין ומחוץ לדומיין.
    • 1.1.0 (ברירת מחדל): עוד ממד מפוצל למקור (wikihow לעומת Activitynet)
  • גודל הורדה : 68.18 MiB

  • גודל ערכת נתונים: 107.45 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'test' 10,003
'test_ind_activitynet' 1,870
'test_ind_wikihow' 3,132
'test_ood_activitynet' 1,651
'test_ood_wikihow' 3,350
'train' 39,905
'train_activitynet' 14,740
'train_wikihow' 25,165
'validation' 10,042
'validation_ind_activitynet' 1,809
'validation_ind_wikihow' 3,192
'validation_ood_activitynet' 1,434
'validation_ood_wikihow' 3,607
  • מבנה תכונה :
FeaturesDict({
    'activity_label': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'endings': Sequence(Text(shape=(), dtype=string)),
    'label': int32,
    'source_id': Text(shape=(), dtype=string),
    'split_type': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תווית_פעילות טֶקסט חוּט
הֶקשֵׁר טֶקסט חוּט
סיומים רצף (טקסט) (אף אחד,) חוּט
תווית מוֹתֵחַ int32
מזהה_מקור טֶקסט חוּט
split_type טֶקסט חוּט
  • ציטוט :
@inproceedings{zellers2019hellaswag,
    title={HellaSwag: Can a Machine Really Finish Your Sentence?},
    author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
    booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
    year={2019}
}