- Deskripsi :
BoolQ adalah kumpulan data penjawab pertanyaan untuk pertanyaan ya/tidak yang berisi 15942 contoh. Pertanyaan-pertanyaan ini terjadi secara alami, mereka dihasilkan dalam pengaturan yang tidak diminta dan tidak dibatasi.
Setiap contoh adalah triplet dari (pertanyaan, bagian, jawaban), dengan judul halaman sebagai konteks tambahan opsional. Penyiapan klasifikasi pasangan teks mirip dengan tugas inferensi bahasa alami yang ada.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/google-research-datasets/boolean-questions
Kode sumber :
tfds.datasets.bool_q.Builder
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
8.36 MiB
Ukuran dataset :
8.51 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 9.427 |
'validation' | 3.270 |
- Struktur fitur :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
menjawab | Tensor | bool | ||
jalan | Teks | rangkaian | ||
pertanyaan | Teks | rangkaian | ||
judul | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}