- Descrição :
QUALITY, um conjunto de dados de compreensão de leitura longa e de múltipla escolha.
Nós fornecemos apenas a versão bruta.
Página inicial : https://github.com/nyu-mll/quality
Código -fonte:
tfds.datasets.quality.Builder
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
17.26 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- Estrutura de recursos :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- Documentação do recurso:
Funcionalidade | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
artigo | Texto | fragmento | ||
artigo_id | Texto | fragmento | ||
dificuldades | Sequência(Tensor) | (Nenhum,) | bool | |
gold_labels | Sequência(Tensor) | (Nenhum,) | int32 | |
opções | Sequência(Sequência(Texto)) | (Nenhuma, Nenhuma) | fragmento | |
question_ids | Sequência (Texto) | (Nenhum,) | fragmento | |
questões | Sequência (Texto) | (Nenhum,) | fragmento | |
set_unique_id | Texto | fragmento | ||
fonte | Texto | fragmento | ||
título | Texto | fragmento | ||
tópico | Texto | fragmento | ||
url | Texto | fragmento | ||
escritor_id | Texto | fragmento | ||
Writer_labels | Sequência(Tensor) | (Nenhum,) | int32 |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não compatível.
Citação :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
qualidade/raw (configuração padrão)
Descrição da configuração : Raw com HTML.
Tamanho do conjunto de dados :
22.18 MiB
Exemplos ( tfds.as_dataframe ):
qualidade/despojado
Descrição da configuração : Sem HTML.
Tamanho do conjunto de dados :
20.73 MiB
Exemplos ( tfds.as_dataframe ):