- Mô tả :
Race là bộ dữ liệu đọc hiểu quy mô lớn với hơn 28.000 đoạn văn và gần 100.000 câu hỏi. Bộ dữ liệu được thu thập từ các kỳ thi tiếng Anh ở Trung Quốc, được thiết kế cho học sinh trung học cơ sở và trung học phổ thông. Tập dữ liệu có thể được dùng làm tập huấn luyện và kiểm tra để hiểu máy.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Mô tả cấu hình : Cấu hình trình tạo cho bộ dữ liệu RACE.
Trang chủ : https://www.cs.cmu.edu/~glai1/data/race/
Mã nguồn :
tfds.datasets.race.Builder
Phiên bản :
-
1.0.0
: Bản phát hành đầu tiên. -
2.0.0
(mặc định): Thêm id ví dụ.
-
Kích thước tải xuống :
24.26 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Cấu trúc tính năng :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
câu trả lời | Trình tự (Văn bản) | (Không có,) | chuỗi | |
mạo từ | Chữ | chuỗi | ||
ví dụ_id | Chữ | chuỗi | ||
tùy chọn | Trình tự(Trình tự(Văn bản)) | (Không có, không có) | chuỗi | |
câu hỏi | Trình tự (Văn bản) | (Không có,) | chuỗi |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
chủng tộc/cao (cấu hình mặc định)
Kích thước tập dữ liệu :
52.39 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'dev' | 1.021 |
'test' | 1.045 |
'train' | 18,728 |
- Ví dụ ( tfds.as_dataframe ):
cuộc đua / giữa
Kích thước tập dữ liệu :
12.51 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- Ví dụ ( tfds.as_dataframe ):