snli, snli

  • Descripción :

El corpus SNLI (versión 1.0) es una colección de 570.000 pares de oraciones en inglés escritas por humanos y etiquetadas manualmente para una clasificación equilibrada con las etiquetas vinculación, contradicción y neutral, lo que respalda la tarea de inferencia del lenguaje natural (NLI), también conocida como reconocimiento de vinculación textual. (RTE).

Separar Ejemplos
'test' 10,000
'train' 550,152
'validation' 10,000
  • Estructura de características :
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
hipótesis Texto cuerda
etiqueta Etiqueta de clase int64
premisa Texto cuerda
  • Cita :
@inproceedings{snli:emnlp2015,
    Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
    Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
    Publisher = {Association for Computational Linguistics},
    Title = {A large annotated corpus for learning natural language inference},
    Year = {2015}
}