научный_хвост

  • Описание :

Набор данных SciTail представляет собой набор данных, созданный на основе научных экзаменов с несколькими вариантами ответов и веб-предложений. Каждый вопрос и правильный вариант ответа преобразуются в утвердительное утверждение для формирования гипотезы. Информационный поиск используется для получения релевантного текста из большого текстового корпуса веб-предложений, и эти предложения используются в качестве предпосылки P. Аннотация такой пары предпосылка-гипотеза краудсорсинг как поддерживает (подразумевает) или нет (нейтрально), чтобы для создания набора данных SciTail. Набор данных содержит 27 026 примеров, из них 10 101 пример с меткой влечет за собой и 16 925 примеров с нейтральной меткой.

  • Домашняя страница : https://allenai.org/data/scitail

  • Исходный код : tfds.text.scitail.SciTail

  • Версии :

    • 1.0.0 (по умолчанию): Первоначальный выпуск.
  • Размер загрузки : 13.52 MiB .

  • Размер набора данных : 6.01 MiB

  • Автоматическое кэширование ( документация ): Да

  • Сплиты :

Расколоть Примеры
'test' 2126
'train' 23 097
'validation' 1304
  • Структура функции :
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'premise': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
гипотеза Текст tf.string
этикетка Метка класса tf.int64
помещение Текст tf.string
  • Цитата :
@inproceedings{khot2018scitail,
    title={Scitail: A textual entailment dataset from science question answering},
    author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
    booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
    url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
    year={2018}
}