cuộc đua

  • Mô tả :

Race là bộ dữ liệu đọc hiểu quy mô lớn với hơn 28.000 đoạn văn và gần 100.000 câu hỏi. Bộ dữ liệu được thu thập từ các kỳ thi tiếng Anh ở Trung Quốc, được thiết kế cho học sinh trung học cơ sở và trung học phổ thông. Tập dữ liệu có thể được dùng làm tập huấn luyện và kiểm tra để hiểu máy.

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=string)),
    'article': Text(shape=(), dtype=string),
    'example_id': Text(shape=(), dtype=string),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'questions': Sequence(Text(shape=(), dtype=string)),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
câu trả lời Trình tự (Văn bản) (Không có,) chuỗi
mạo từ Chữ chuỗi
ví dụ_id Chữ chuỗi
tùy chọn Trình tự(Trình tự(Văn bản)) (Không có, không có) chuỗi
câu hỏi Trình tự (Văn bản) (Không có,) chuỗi
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

chủng tộc/cao (cấu hình mặc định)

  • Kích thước tập dữ liệu : 52.39 MiB

  • Chia tách :

Tách ra ví dụ
'dev' 1.021
'test' 1.045
'train' 18,728

cuộc đua / giữa

  • Kích thước tập dữ liệu : 12.51 MiB

  • Chia tách :

Tách ra ví dụ
'dev' 368
'test' 362
'train' 6,409