snli

  • Mô tả:

Kho ngữ liệu SNLI (phiên bản 1.0) là một tập hợp gồm 570 nghìn cặp câu tiếng Anh do con người viết được gắn nhãn thủ công để phân loại cân bằng với các nhãn liên quan, mâu thuẫn và trung lập, hỗ trợ nhiệm vụ suy luận ngôn ngữ tự nhiên (NLI), còn được gọi là nhận dạng câu văn bản (RTE).

Tách ra Các ví dụ
'test' 10.000
'train' 550.152
'validation' 10.000
  • Các tính năng:
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'premise': Text(shape=(), dtype=tf.string),
})
  • Trích dẫn:
@inproceedings{snli:emnlp2015,
    Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
    Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
    Publisher = {Association for Computational Linguistics},
    Title = {A large annotated corpus for learning natural language inference},
    Year = {2015}
}