- Descrição :
Conjunto de dados descrito no artigo: Instruções não naturais: ajustando modelos de linguagem com (quase) nenhum trabalho humano (2022). Contém conjuntos de instruções em linguagem natural, com restrições opcionais/reformulações geradas pelo LLM.
Página inicial : https://github.com/orhonovich/unnatural-instructions
Código -fonte:
tfds.text.unnatural_instructions.UnnaturalInstructions
Versões :
-
0.0.1
(padrão): Versão inicial. Omita instruções/entradas, pois requerem processamento adicional para serem usadas. Instrução_com_entradas e reformulações contêm instruções e contextos.
-
Tamanho do download :
17.48 MiB
Tamanho do conjunto de dados :
154.71 MiB
Armazenado em cache automaticamente ( documentação ): Somente quando
shuffle_files=False
(train)Divisões :
Dividir | Exemplos |
---|---|
'train' | 66.010 |
- Estrutura de recursos :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
Eu iria | Texto | corda | Identificador exclusivo, por exemplo. | |
instâncias | Seqüência | |||
instâncias/restrições | Texto | corda | Restrições específicas da tarefa. | |
instâncias/entrada | Texto | corda | Entrada a ser alimentada em espaços reservados para instruções fornecidas. | |
instâncias/instrução_com_entrada | Texto | corda | Instruções com entradas fornecidas aos espaços reservados. | |
instâncias/saída | Texto | corda | Saída de destino para determinada tarefa. | |
instrução | Texto | corda | Instrução com espaço reservado para entradas. | |
reformulações | Seqüência | |||
reformulações/entradas | Texto | corda | Entrada a ser alimentada em espaços reservados para instruções fornecidas. | |
reformulações/instrução | Texto | corda | Instrução com espaço reservado para entradas. | |
reformulações/instrução_com_entrada | Texto | corda | Instruções com entradas fornecidas aos espaços reservados. | |
reformulações/saída | Texto | corda | Saída de destino para determinada tarefa. |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):
- Citação :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}