- Mô tả :
Ngữ liệu SNLI (phiên bản 1.0) là một tập hợp gồm 570 nghìn cặp câu tiếng Anh do con người viết được gắn nhãn thủ công để phân loại cân bằng với các nhãn dẫn xuất, mâu thuẫn và trung lập, hỗ trợ nhiệm vụ suy luận ngôn ngữ tự nhiên (NLI), còn được gọi là nhận dạng văn bản dẫn xuất (RTE).
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://nlp.stanford.edu/projects/snli/
Mã nguồn :
tfds.datasets.snli.Builder
Phiên bản :
-
1.1.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
90.17 MiB
Kích thước tập dữ liệu :
87.00 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 10.000 |
'train' | 550,152 |
'validation' | 10.000 |
- Cấu trúc tính năng :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Đặc tính | Tầng lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
giả thuyết | Chữ | chuỗi | ||
nhãn | LớpNhãn | int64 | ||
tiền đề | Chữ | chuỗi |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}