đội hình

 • Mô tả:

Tập dữ liệu trả lời câu hỏi Stanford (SQuAD) là tập dữ liệu đọc hiểu, bao gồm các câu hỏi do cộng đồng đặt ra trên một tập hợp các bài báo Wikipedia, trong đó câu trả lời cho mọi câu hỏi là một đoạn văn bản hoặc khoảng từ đoạn đọc tương ứng hoặc câu hỏi có thể không trả lời được.

@article{2016arXiv160605250R,
    author = { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
         Konstantin and {Liang}, Percy},
    title = "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
   journal = {arXiv e-prints},
     year = 2016,
     eid = {arXiv:1606.05250},
    pages = {arXiv:1606.05250},
archivePrefix = {arXiv},
    eprint = {1606.05250},
}

đội hình / v1.1 (cấu hình mặc định)

 • Config Mô tả: Phiên bản 1.1.0 của đội hình

 • Dung lượng tải về: 33.51 MiB

 • Dataset kích thước: 94.06 MiB

 • Tự động lưu trữ ( tài liệu ): Có

 • tách:

Tách ra Các ví dụ
'train' 87.599
'validation' 10,570
 • Các tính năng:
FeaturesDict({
  'answers': Sequence({
    'answer_start': tf.int32,
    'text': Text(shape=(), dtype=tf.string),
  }),
  'context': Text(shape=(), dtype=tf.string),
  'id': tf.string,
  'question': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
})

đội hình / v2.0

 • Config Mô tả: Phiên bản 2.0.0 của đội hình

 • Dung lượng tải về: 44.34 MiB

 • Dataset kích thước: 148.54 MiB

 • Tự động lưu trữ ( tài liệu ): Có (xác nhận), Chỉ khi shuffle_files=False (tàu)

 • tách:

Tách ra Các ví dụ
'train' 130.319
'validation' 11.873
 • Các tính năng:
FeaturesDict({
  'answers': Sequence({
    'answer_start': tf.int32,
    'text': Text(shape=(), dtype=tf.string),
  }),
  'context': Text(shape=(), dtype=tf.string),
  'id': tf.string,
  'is_impossible': tf.bool,
  'plausible_answers': Sequence({
    'answer_start': tf.int32,
    'text': Text(shape=(), dtype=tf.string),
  }),
  'question': Text(shape=(), dtype=tf.string),
  'title': Text(shape=(), dtype=tf.string),
})