- Descrição :
O conjunto de dados LAMBADA avalia as capacidades de modelos computacionais para compreensão de texto por meio de uma tarefa de previsão de palavras. LAMBADA é uma coleção de passagens narrativas que compartilham a característica de que sujeitos humanos são capazes de adivinhar sua última palavra se forem expostos a toda a passagem, mas não se virem apenas a última frase que precede a palavra-alvo
Documentação Adicional : Explore em Papers With Code
Página inicial : https://zenodo.org/record/2630551#.X4Xzn5NKjUI
Código-fonte :
tfds.datasets.lambada.Builder
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
319.03 MiB
Tamanho do conjunto de dados :
3.49 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'test' | 5.153 |
'train' | 4.869 |
- Estrutura de recursos :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- Documentação do recurso :
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
passagem | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}