- Mô tả :
Bộ dữ liệu HellaSwag là một điểm chuẩn cho Commonsense NLI. Nó bao gồm một bối cảnh và một số kết thúc hoàn thành bối cảnh.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://rowanzellers.com/hellaswag/
Mã nguồn :
tfds.text.Hellaswag
Phiên bản :
-
0.0.1
: Không có ghi chú phát hành. -
1.0.0
: Thêm các phần tách riêng cho các bộ kiểm tra/xác thực trong miền và ngoài miền. -
1.1.0
(mặc định): Một thứ nguyên phân chia khác cho nguồn (wikihow so với Activitynet)
-
Kích thước tải xuống :
68.18 MiB
Kích thước tập dữ liệu :
107.45 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 10,003 |
'test_ind_activitynet' | 1.870 |
'test_ind_wikihow' | 3.132 |
'test_ood_activitynet' | 1.651 |
'test_ood_wikihow' | 3.350 |
'train' | 39,905 |
'train_activitynet' | 14.740 |
'train_wikihow' | 25,165 |
'validation' | 10,042 |
'validation_ind_activitynet' | 1.809 |
'validation_ind_wikihow' | 3.192 |
'validation_ood_activitynet' | 1,434 |
'validation_ood_wikihow' | 3,607 |
- Cấu trúc tính năng :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
hoạt động_nhãn | Chữ | sợi dây | ||
định nghĩa bài văn | Chữ | sợi dây | ||
kết thúc | Trình tự (Văn bản) | (Không có,) | sợi dây | |
nhãn mác | tenxơ | int32 | ||
nguồn_id | Chữ | sợi dây | ||
loại phân chia | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}