- Descrição :
Race é um conjunto de dados de compreensão de leitura em larga escala com mais de 28.000 passagens e quase 100.000 perguntas. O conjunto de dados é coletado de exames de inglês na China, que são projetados para alunos do ensino fundamental e médio. O conjunto de dados pode ser servido como conjuntos de treinamento e teste para compreensão da máquina.
Documentação Adicional : Explore em Papers With Code
Descrição da configuração : configuração do construtor para o conjunto de dados RACE.
Página inicial : https://www.cs.cmu.edu/~glai1/data/race/
Código -fonte:
tfds.datasets.race.Builder
Versões :
-
1.0.0
: versão inicial. -
2.0.0
(padrão): Adicione o id de exemplo.
-
Tamanho do download :
24.26 MiB
Cache automático ( documentação ): Sim
Estrutura de recursos :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- Documentação do recurso:
Funcionalidade | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
respostas | Sequência (Texto) | (Nenhum,) | fragmento | |
artigo | Texto | fragmento | ||
exemplo_id | Texto | fragmento | ||
opções | Sequência(Sequência(Texto)) | (Nenhuma, Nenhuma) | fragmento | |
questões | Sequência (Texto) | (Nenhum,) | fragmento |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não suportado.
Citação :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
corrida/alta (configuração padrão)
Tamanho do conjunto de dados :
52.39 MiB
Divisões :
Dividir | Exemplos |
---|---|
'dev' | 1.021 |
'test' | 1.045 |
'train' | 18.728 |
- Exemplos ( tfds.as_dataframe ):
raça/meio
Tamanho do conjunto de dados :
12.51 MiB
Divisões :
Dividir | Exemplos |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6.409 |
- Exemplos ( tfds.as_dataframe ):