unnatural_instructions

  • Описание :

Набор данных, описанный в статье: Неестественные инструкции: настройка языковых моделей с (почти) отсутствием человеческого труда (2022 г.). Содержит наборы инструкций на естественном языке с необязательными ограничениями / переформулировками, созданными LLM.

  • Домашняя страница : https://github.com/orhonovich/unnatural-instructions

  • Исходный код : tfds.text.unnatural_instructions.UnnaturalInstructions

  • Версии :

    • 0.0.1 (по умолчанию): Первоначальный выпуск. Опустите инструкции/вводы, так как они требуют дополнительной обработки. Instruction_with_inputs и переформулировки содержат инструкции и контексты.
  • Размер загрузки : 17.48 MiB

  • Размер набора данных : 154.71 MiB .

  • Автокэширование ( документация ): только когда shuffle_files=False (поезд)

  • Сплиты :

Расколоть Примеры
'train' 66 010
  • Структура функции :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'instances': Sequence({
        'constraints': Text(shape=(), dtype=string),
        'input': Text(shape=(), dtype=string),
        'instruction_with_input': Text(shape=(), dtype=string),
        'output': Text(shape=(), dtype=string),
    }),
    'instruction': Text(shape=(), dtype=string),
    'reformulations': Sequence({
        'input': Text(shape=(), dtype=string),
        'instruction': Text(shape=(), dtype=string),
        'instruction_with_input': Text(shape=(), dtype=string),
        'output': Text(shape=(), dtype=string),
    }),
})
  • Документация по функциям :
Характерная черта Класс Форма Dтип Описание
ОсобенностиDict
я бы Текст нить Уникальный идентификатор, например.
экземпляры Последовательность
экземпляры/ограничения Текст нить Ограничения, специфичные для задачи.
экземпляры/ввод Текст нить Входные данные для ввода в заполнители для данной инструкции.
экземпляры/instruction_with_input Текст нить Инструкции с входными данными для заполнителей.
экземпляры/вывод Текст нить Целевой результат для данной задачи.
инструкция Текст нить Инструкция с заполнителем для входных данных.
переформулировки Последовательность
переформулировки/ввод Текст нить Входные данные для ввода в заполнители для данной инструкции.
переформулировка/инструкция Текст нить Инструкция с заполнителем для входных данных.
переформулировки/instruction_with_input Текст нить Инструкции с входными данными для заполнителей.
переформулировка/вывод Текст нить Целевой результат для данной задачи.
  • Цитата :
@misc{honovich2022unnatural,
      title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
      author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
      url = {https://arxiv.org/abs/2212.09689},
      publisher = {arXiv},
      year={2022}
}