unnatural_instructions

  • Описание :

Набор данных, описанный в статье: Неестественные инструкции: настройка языковых моделей с (почти) отсутствием человеческого труда (2022 г.). Содержит наборы инструкций на естественном языке с необязательными ограничениями / переформулировками, созданными LLM.

  • Домашняя страница : https://github.com/orhonovich/unnatural-instructions

  • Исходный код : tfds.text.unnatural_instructions.UnnaturalInstructions

  • Версии :

    • 0.0.1 (по умолчанию): Первоначальный выпуск. Опустите инструкции/вводы, так как они требуют дополнительной обработки. Instruction_with_inputs и переформулировки содержат инструкции и контексты.
  • Размер загрузки : 17.48 MiB

  • Размер набора данных : 154.71 MiB .

  • Автокэширование ( документация ): только когда shuffle_files=False (поезд)

  • Сплиты :

Расколоть Примеры
'train' 66 010
  • Структура функции :
FeaturesDict({
   
'id': Text(shape=(), dtype=string),
   
'instances': Sequence({
       
'constraints': Text(shape=(), dtype=string),
       
'input': Text(shape=(), dtype=string),
       
'instruction_with_input': Text(shape=(), dtype=string),
       
'output': Text(shape=(), dtype=string),
   
}),
   
'instruction': Text(shape=(), dtype=string),
   
'reformulations': Sequence({
       
'input': Text(shape=(), dtype=string),
       
'instruction': Text(shape=(), dtype=string),
       
'instruction_with_input': Text(shape=(), dtype=string),
       
'output': Text(shape=(), dtype=string),
   
}),
})
  • Документация по функциям :
Характерная черта Класс Форма Dтип Описание
ОсобенностиDict
я бы Текст нить Уникальный идентификатор, например.
экземпляры Последовательность
экземпляры/ограничения Текст нить Ограничения, специфичные для задачи.
экземпляры/ввод Текст нить Входные данные для ввода в заполнители для данной инструкции.
экземпляры/instruction_with_input Текст нить Инструкции с входными данными для заполнителей.
экземпляры/вывод Текст нить Целевой результат для данной задачи.
инструкция Текст нить Инструкция с заполнителем для входных данных.
переформулировки Последовательность
переформулировки/ввод Текст нить Входные данные для ввода в заполнители для данной инструкции.
переформулировка/инструкция Текст нить Инструкция с заполнителем для входных данных.
переформулировки/instruction_with_input Текст нить Инструкции с входными данными для заполнителей.
переформулировка/вывод Текст нить Целевой результат для данной задачи.
  • Цитата :
@misc{honovich2022unnatural,
      title
= {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
      author
= {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
      url
= {https://arxiv.org/abs/2212.09689},
      publisher
= {arXiv},
      year
={2022}
}