- Deskripsi :
KUALITAS, kumpulan data pemahaman pilihan ganda dan bacaan panjang.
Kami hanya menyediakan versi mentah.
Beranda : https://github.com/nyu-mll/quality
Kode sumber :
tfds.datasets.quality.Builder
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
17.26 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- Struktur fitur :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
artikel | Teks | rangkaian | ||
article_id | Teks | rangkaian | ||
kesulitan | Urutan (Tensor) | (Tidak ada,) | bool | |
gold_labels | Urutan (Tensor) | (Tidak ada,) | int32 | |
pilihan | Urutan(Urutan(Teks)) | (Tidak ada, Tidak ada) | rangkaian | |
id_pertanyaan | Urutan (Teks) | (Tidak ada,) | rangkaian | |
pertanyaan | Urutan (Teks) | (Tidak ada,) | rangkaian | |
set_unique_id | Teks | rangkaian | ||
sumber | Teks | rangkaian | ||
judul | Teks | rangkaian | ||
tema | Teks | rangkaian | ||
url | Teks | rangkaian | ||
id_penulis | Teks | rangkaian | ||
penulis_label | Urutan (Tensor) | (Tidak ada,) | int32 |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
kualitas/mentah (konfigurasi default)
Deskripsi konfigurasi : Mentah dengan HTML.
Ukuran dataset :
22.18 MiB
Contoh ( tfds.as_dataframe ):
kualitas / dilucuti
Deskripsi konfigurasi : Dilucuti dari HTML.
Ukuran dataset :
20.73 MiB
Contoh ( tfds.as_dataframe ):