- Descrição :
Eraser Multi RC é um conjunto de dados para consultas em passagens de várias linhas, juntamente com respostas e uma justificativa. Cada exemplo neste conjunto de dados tem as 5 partes a seguir
- Uma passagem de múltiplas linhas 2. Uma pergunta sobre a passagem 3. Uma resposta à pergunta
- A Classificação sobre se a resposta está certa ou errada 5. Uma Explicação justificando a classificação
Documentação Adicional : Explore em Papers With Code
Página inicial : https://cogcomp.seas.upenn.edu/multirc/
Código -fonte:
tfds.text.EraserMultiRc
Versões :
-
0.1.1
(padrão): sem notas de versão.
-
Tamanho do download :
1.59 MiB
Tamanho do conjunto de dados :
62.59 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'test' | 4.848 |
'train' | 24.029 |
'validation' | 3.214 |
- Estrutura de recursos :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
evidências | Sequência (Texto) | (Nenhum,) | corda | |
etiqueta | ClassLabel | int64 | ||
passagem | Texto | corda | ||
consulta_e_resposta | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}