- توضیحات :
مجموعه داده HellaSwag یک معیار برای Commonsense NLI است. این شامل یک زمینه و برخی از پایان ها است که زمینه را کامل می کند.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://rowanzellers.com/hellaswag/
کد منبع :
tfds.text.Hellaswag
نسخه ها :
-
0.0.1
: بدون یادداشت انتشار. -
1.0.0
: اضافه کردن تقسیمهای جداگانه برای مجموعههای آزمایشی و اعتبارسنجی درون دامنه و خارج از دامنه. -
1.1.0
(پیشفرض): یکی دیگر از ابعاد تقسیم شده برای منبع (wikihow در مقابل اکتیویتینت)
-
حجم دانلود :
68.18 MiB
حجم مجموعه داده :
107.45 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 10003 |
'test_ind_activitynet' | 1,870 |
'test_ind_wikihow' | 3,132 |
'test_ood_activitynet' | 1,651 |
'test_ood_wikihow' | 3,350 |
'train' | 39905 |
'train_activitynet' | 14740 |
'train_wikihow' | 25,165 |
'validation' | 10,042 |
'validation_ind_activitynet' | 1,809 |
'validation_ind_wikihow' | 3,192 |
'validation_ood_activitynet' | 1,434 |
'validation_ood_wikihow' | 3,607 |
- ساختار ویژگی :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
فعالیت_برچسب | متن | رشته | ||
متن نوشته | متن | رشته | ||
پایان ها | دنباله (متن) | (هیچ یک،) | رشته | |
برچسب | تانسور | int32 | ||
source_id | متن | رشته | ||
split_type | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}