hellaswag

  • Mô tả :

Bộ dữ liệu HellaSwag là một điểm chuẩn cho Commonsense NLI. Nó bao gồm một bối cảnh và một số kết thúc hoàn thành bối cảnh.

  • Tài liệu bổ sung : Khám phá trên giấy tờ với mã

  • Trang chủ : https://rowanzellers.com/hellaswag/

  • Mã nguồn : tfds.text.Hellaswag

  • Phiên bản :

    • 0.0.1 : Không có ghi chú phát hành.
    • 1.0.0 : Thêm các phần tách riêng cho các bộ kiểm tra/xác thực trong miền và ngoài miền.
    • 1.1.0 (mặc định): Một thứ nguyên phân chia khác cho nguồn (wikihow so với Activitynet)
  • Kích thước tải xuống : 68.18 MiB

  • Kích thước tập dữ liệu : 107.45 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'test' 10,003
'test_ind_activitynet' 1.870
'test_ind_wikihow' 3.132
'test_ood_activitynet' 1.651
'test_ood_wikihow' 3.350
'train' 39,905
'train_activitynet' 14.740
'train_wikihow' 25,165
'validation' 10,042
'validation_ind_activitynet' 1.809
'validation_ind_wikihow' 3.192
'validation_ood_activitynet' 1,434
'validation_ood_wikihow' 3,607
  • Cấu trúc tính năng :
FeaturesDict({
    'activity_label': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'endings': Sequence(Text(shape=(), dtype=string)),
    'label': int32,
    'source_id': Text(shape=(), dtype=string),
    'split_type': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hoạt động_nhãn Chữ sợi dây
định nghĩa bài văn Chữ sợi dây
kết thúc Trình tự (Văn bản) (Không có,) sợi dây
nhãn mác tenxơ int32
nguồn_id Chữ sợi dây
loại phân chia Chữ sợi dây
  • trích dẫn :
@inproceedings{zellers2019hellaswag,
    title={HellaSwag: Can a Machine Really Finish Your Sentence?},
    author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
    booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
    year={2019}
}