- Descrição :
O conjunto de dados contém 5.957 questões de múltipla escolha de 4 vias. Além disso, eles fornecem 5.167 fatos de conhecimento comum de origem coletiva e uma versão expandida das perguntas de treinamento/desenvolvimento/teste em que cada pergunta é associada ao seu fato central de origem, uma pontuação de precisão humana, uma pontuação de clareza e um trabalhador anônimo anônimo. EU IRIA.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://leaderboard.allenai.org/open_book_qa/submissions/get-started
Código -fonte:
tfds.datasets.openbookqa.Builder
Versões :
-
0.1.0
(padrão): sem notas de versão.
-
Tamanho do download :
1.38 MiB
Tamanho do conjunto de dados :
2.40 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'test' | 500 |
'train' | 4.957 |
'validation' | 500 |
- Estrutura de recursos :
FeaturesDict({
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
'clarity': float32,
'fact1': Text(shape=(), dtype=string),
'humanScore': float32,
'question': FeaturesDict({
'choice_A': Text(shape=(), dtype=string),
'choice_B': Text(shape=(), dtype=string),
'choice_C': Text(shape=(), dtype=string),
'choice_D': Text(shape=(), dtype=string),
'stem': Text(shape=(), dtype=string),
}),
'turkIdAnonymized': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
palavra chave | ClassLabel | int64 | ||
clareza | tensor | float32 | ||
fato1 | Texto | corda | ||
pontuação humana | tensor | float32 | ||
pergunta | RecursosDict | |||
pergunta/escolha_A | Texto | corda | ||
pergunta/opção_B | Texto | corda | ||
pergunta/escolha_C | Texto | corda | ||
pergunta/escolha_D | Texto | corda | ||
pergunta/tronco | Texto | corda | ||
turkIdAnonymized | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('question', 'answerKey')
Figura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):
- Citação :
@article{mihaylov2018can,
title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
journal={arXiv preprint arXiv:1809.02789},
year={2018}
}