multi_nli

 • Mô tả:

Kho ngữ liệu suy luận ngôn ngữ tự nhiên đa thể loại (MultiNLI) là một bộ sưu tập có nguồn gốc từ cộng đồng gồm 433 nghìn cặp câu được chú thích bằng thông tin liên quan đến văn bản. Kho ngữ liệu được mô hình hóa dựa trên kho ngữ liệu SNLI, nhưng khác ở chỗ bao gồm nhiều thể loại văn bản nói và viết, đồng thời hỗ trợ đánh giá khái quát đa thể loại đặc biệt. Tài liệu này là cơ sở cho nhiệm vụ chung của Hội thảo RepEval 2017 tại EMNLP ở Copenhagen.

Tách ra Các ví dụ
'train' 392.702
'validation_matched' 9,815
'validation_mismatched' 9,832
 • Các tính năng:
FeaturesDict({
  'hypothesis': Text(shape=(), dtype=tf.string),
  'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
  'premise': Text(shape=(), dtype=tf.string),
})
 • Trích dẫn:
@InProceedings{N18-1101,
 author = "Williams, Adina
      and Nangia, Nikita
      and Bowman, Samuel",
 title = "A Broad-Coverage Challenge Corpus for
      Sentence Understanding through Inference",
 booktitle = "Proceedings of the 2018 Conference of
        the North American Chapter of the
        Association for Computational Linguistics:
        Human Language Technologies, Volume 1 (Long
        Papers)",
 year = "2018",
 publisher = "Association for Computational Linguistics",
 pages = "1112--1122",
 location = "New Orleans, Louisiana",
 url = "http://aclweb.org/anthology/N18-1101"
}