- Deskripsi :
Korpus SNLI (versi 1.0) adalah kumpulan 570k pasangan kalimat bahasa Inggris tulisan manusia yang dilabeli secara manual untuk klasifikasi berimbang dengan label keterisian, kontradiksi, dan netral, mendukung tugas inferensi bahasa alami (NLI), juga dikenal sebagai mengenali keteraturan tekstual (RTE).
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://nlp.stanford.edu/projects/snli/
Kode sumber :
tfds.datasets.snli.Builder
Versi :
-
1.1.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
90.17 MiB
Ukuran dataset :
87.00 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 10.000 |
'train' | 550.152 |
'validation' | 10.000 |
- Struktur fitur :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
hipotesa | Teks | rangkaian | ||
label | LabelKelas | int64 | ||
premis | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}