cuộc đua

  • Mô tả :

Race là một bộ dữ liệu đọc hiểu quy mô lớn với hơn 28.000 đoạn văn và gần 100.000 câu hỏi. Bộ dữ liệu được thu thập từ các kỳ thi tiếng Anh ở Trung Quốc, được thiết kế cho học sinh trung học cơ sở và trung học phổ thông. Tập dữ liệu có thể được dùng làm tập huấn luyện và kiểm tra để hiểu máy.

  • Mô tả cấu hình : Cấu hình trình tạo cho tập dữ liệu RACE.

  • Trang chủ : https://www.cs.cmu.edu/~glai1/data/race/

  • Mã nguồn : tfds.text.race.Race

  • Các phiên bản :

    • 1.0.0 : Bản phát hành ban đầu.
    • 2.0.0 (mặc định): Thêm id ví dụ.
  • Kích thước tải xuống : 24.26 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Các tính năng :

FeaturesDict({
    'answers': Sequence(Text(shape=(), dtype=tf.string)),
    'article': Text(shape=(), dtype=tf.string),
    'example_id': Text(shape=(), dtype=tf.string),
    'options': Sequence(Sequence(Text(shape=(), dtype=tf.string))),
    'questions': Sequence(Text(shape=(), dtype=tf.string)),
})
@article{lai2017large,
    title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal={arXiv preprint arXiv:1704.04683},
    year={2017}
}

chủng tộc / cao (cấu hình mặc định)

  • Kích thước tập dữ liệu: 52.39 MiB

  • Tách :

Tách ra Các ví dụ
'dev' 1,021
'test' 1,045
'train' 18.728

chủng tộc / trung lưu

  • Kích thước tập dữ liệu : 12.51 MiB

  • Tách :

Tách ra Các ví dụ
'dev' 368
'test' 362
'train' 6,409