- Deskripsi :
MC-TACO adalah kumpulan data dari 13k pasangan pertanyaan-jawaban yang membutuhkan pemahaman akal sehat temporal. Dataset berisi lima properti temporal:
- durasi (berapa lama waktu yang dibutuhkan suatu acara)
- pemesanan temporal (urutan khas peristiwa)
- waktu yang khas (ketika suatu peristiwa terjadi)
- frekuensi (seberapa sering suatu peristiwa terjadi)
- stasioneritas (apakah suatu keadaan dipertahankan untuk waktu yang sangat lama atau tanpa batas waktu)
Kami berharap kumpulan data ini dapat mempromosikan eksplorasi masa depan dari kelas masalah penalaran khusus ini.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/CogComp/MCTACO
Kode sumber :
tfds.datasets.mctaco.Builder
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
2.27 MiB
Ukuran dataset :
3.18 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 9.442 |
'validation' | 3.783 |
- Struktur fitur :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
menjawab | Teks | rangkaian | ||
kategori | LabelKelas | int64 | ||
label | LabelKelas | int64 | ||
pertanyaan | Teks | rangkaian | ||
kalimat | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}