raça

  • Descrição :

Race é um conjunto de dados de compreensão de leitura em larga escala com mais de 28.000 passagens e quase 100.000 perguntas. O conjunto de dados é coletado de exames de inglês na China, que são projetados para alunos do ensino fundamental e médio. O conjunto de dados pode ser servido como conjuntos de treinamento e teste para compreensão da máquina.

FeaturesDict({
   
'answers': Sequence(Text(shape=(), dtype=string)),
   
'article': Text(shape=(), dtype=string),
   
'example_id': Text(shape=(), dtype=string),
   
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
   
'questions': Sequence(Text(shape=(), dtype=string)),
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
respostas Sequência (Texto) (Nenhum,) fragmento
artigo Texto fragmento
exemplo_id Texto fragmento
opções Sequência(Sequência(Texto)) (Nenhuma, Nenhuma) fragmento
questões Sequência (Texto) (Nenhum,) fragmento
@article{lai2017large,
    title
={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
    author
={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
    journal
={arXiv preprint arXiv:1704.04683},
    year
={2017}
}

corrida/alta (configuração padrão)

  • Tamanho do conjunto de dados : 52.39 MiB

  • Divisões :

Dividir Exemplos
'dev' 1.021
'test' 1.045
'train' 18.728

raça/meio

  • Tamanho do conjunto de dados : 12.51 MiB

  • Divisões :

Dividir Exemplos
'dev' 368
'test' 362
'train' 6.409