kualitas

  • Deskripsi :

KUALITAS, kumpulan data pemahaman pilihan ganda dan bacaan panjang.

Kami hanya menyediakan versi mentah.

Membelah Contoh
'dev' 230
'test' 232
'train' 300
  • Struktur fitur :
FeaturesDict({
    'article': Text(shape=(), dtype=string),
    'article_id': Text(shape=(), dtype=string),
    'difficults': Sequence(bool),
    'gold_labels': Sequence(int32),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'question_ids': Sequence(Text(shape=(), dtype=string)),
    'questions': Sequence(Text(shape=(), dtype=string)),
    'set_unique_id': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'topic': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'writer_id': Text(shape=(), dtype=string),
    'writer_labels': Sequence(int32),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
artikel Teks rangkaian
article_id Teks rangkaian
kesulitan Urutan (Tensor) (Tidak ada,) bool
gold_labels Urutan (Tensor) (Tidak ada,) int32
pilihan Urutan(Urutan(Teks)) (Tidak ada, Tidak ada) rangkaian
id_pertanyaan Urutan (Teks) (Tidak ada,) rangkaian
pertanyaan Urutan (Teks) (Tidak ada,) rangkaian
set_unique_id Teks rangkaian
sumber Teks rangkaian
judul Teks rangkaian
tema Teks rangkaian
url Teks rangkaian
id_penulis Teks rangkaian
penulis_label Urutan (Tensor) (Tidak ada,) int32
@article{pang2021quality,
  title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
  author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
  journal={arXiv preprint arXiv:2112.08608},
  year={2021}
}

kualitas/mentah (konfigurasi default)

  • Deskripsi konfigurasi : Mentah dengan HTML.

  • Ukuran dataset : 22.18 MiB

  • Contoh ( tfds.as_dataframe ):

kualitas / dilucuti

  • Deskripsi konfigurasi : Dilucuti dari HTML.

  • Ukuran dataset : 20.73 MiB

  • Contoh ( tfds.as_dataframe ):