unnatural_instructions

  • 説明:

論文で説明されているデータセット: Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor (2022)。オプションの制約 / LLM によって生成された再定式化を含む、自然言語命令のセットが含まれています。

スプリット
'train' 66,010
  • 機能構造:
FeaturesDict({
   
'id': Text(shape=(), dtype=string),
   
'instances': Sequence({
       
'constraints': Text(shape=(), dtype=string),
       
'input': Text(shape=(), dtype=string),
       
'instruction_with_input': Text(shape=(), dtype=string),
       
'output': Text(shape=(), dtype=string),
   
}),
   
'instruction': Text(shape=(), dtype=string),
   
'reformulations': Sequence({
       
'input': Text(shape=(), dtype=string),
       
'instruction': Text(shape=(), dtype=string),
       
'instruction_with_input': Text(shape=(), dtype=string),
       
'output': Text(shape=(), dtype=string),
   
}),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ID文章ストリングたとえば、一意の識別子。
インスタンス順序
インスタンス/制約文章ストリングタスク固有の制約。
インスタンス/入力文章ストリング指定された命令のプレースホルダーに入力される入力。
インスタンス/instruction_with_input文章ストリングプレースホルダーに提供される入力を含む命令。
インスタンス/出力文章ストリング特定のタスクのターゲット出力。
命令文章ストリング入力用のプレースホルダー付きの命令。
再定式化順序
再定式化/入力文章ストリング指定された命令のプレースホルダーに入力される入力。
再定式化/指示文章ストリング入力用のプレースホルダー付きの命令。
再定式化/instruction_with_input文章ストリングプレースホルダーに提供される入力を含む命令。
再定式化/出力文章ストリング特定のタスクのターゲット出力。
  • 引用
@misc{honovich2022unnatural,
      title
= {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
      author
= {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
      url
= {https://arxiv.org/abs/2212.09689},
      publisher
= {arXiv},
      year
={2022}
}