openbookqa

  • Descrição :

O conjunto de dados contém 5.957 questões de múltipla escolha de 4 vias. Além disso, eles fornecem 5.167 fatos de conhecimento comum de origem coletiva e uma versão expandida das perguntas de treinamento/desenvolvimento/teste em que cada pergunta é associada ao seu fato central de origem, uma pontuação de precisão humana, uma pontuação de clareza e um trabalhador anônimo anônimo. EU IRIA.

Dividir Exemplos
'test' 500
'train' 4.957
'validation' 500
  • Estrutura de recursos :
FeaturesDict({
   
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
   
'clarity': float32,
   
'fact1': Text(shape=(), dtype=string),
   
'humanScore': float32,
   
'question': FeaturesDict({
       
'choice_A': Text(shape=(), dtype=string),
       
'choice_B': Text(shape=(), dtype=string),
       
'choice_C': Text(shape=(), dtype=string),
       
'choice_D': Text(shape=(), dtype=string),
       
'stem': Text(shape=(), dtype=string),
   
}),
   
'turkIdAnonymized': Text(shape=(), dtype=string),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
palavra chave ClassLabel int64
clareza tensor float32
fato1 Texto corda
pontuação humana tensor float32
pergunta RecursosDict
pergunta/escolha_A Texto corda
pergunta/opção_B Texto corda
pergunta/escolha_C Texto corda
pergunta/escolha_D Texto corda
pergunta/tronco Texto corda
turkIdAnonymized Texto corda
  • Citação :
@article{mihaylov2018can,
  title
={Can a suit of armor conduct electricity? a new dataset for open book question answering},
  author
={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
  journal
={arXiv preprint arXiv:1809.02789},
  year
={2018}
}