- Descrição :
Grounded SCAN (gSCAN) é um conjunto de dados sintético para avaliar a generalização composicional na compreensão da linguagem situada. O gSCAN combina instruções de linguagem natural com sequências de ação e requer que o agente interprete as instruções dentro do contexto de um ambiente de navegação visual baseado em grade.
Mais informações podem ser encontradas em:
Para a
compositional_splits
e otarget_length_split
: https://github.com/LauraRuis/groundedSCANPara os
spatial_relation_splits
: https://github.com/google-research/language/tree/master/language/gscan/dataPágina inicial : https://github.com/LauraRuis/groundedSCAN
Código-fonte :
tfds.vision_language.grounded_scan.GroundedScan
Versões :
-
1.0.0
: versão inicial. -
1.1.0
: Alterado recursovector
para Text(). -
2.0.0
(padrão): Adiciona a nova configuração de space_relation_splits.
-
Armazenado em cache automaticamente ( documentação ): Não
Estrutura de recursos :
FeaturesDict({
'command': Sequence(Text(shape=(), dtype=string)),
'manner': Text(shape=(), dtype=string),
'meaning': Sequence(Text(shape=(), dtype=string)),
'referred_target': Text(shape=(), dtype=string),
'situation': FeaturesDict({
'agent_direction': int32,
'agent_position': FeaturesDict({
'column': int32,
'row': int32,
}),
'direction_to_target': Text(shape=(), dtype=string),
'distance_to_target': int32,
'grid_size': int32,
'placed_objects': Sequence({
'object': FeaturesDict({
'color': Text(shape=(), dtype=string),
'shape': Text(shape=(), dtype=string),
'size': int32,
}),
'position': FeaturesDict({
'column': int32,
'row': int32,
}),
'vector': Text(shape=(), dtype=string),
}),
'target_object': FeaturesDict({
'object': FeaturesDict({
'color': Text(shape=(), dtype=string),
'shape': Text(shape=(), dtype=string),
'size': int32,
}),
'position': FeaturesDict({
'column': int32,
'row': int32,
}),
'vector': Text(shape=(), dtype=string),
}),
}),
'target_commands': Sequence(Text(shape=(), dtype=string)),
'verb_in_command': Text(shape=(), dtype=string),
})
- Documentação do recurso :
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
comando | Sequência (Texto) | (Nenhum,) | corda | |
maneiras | Texto | corda | ||
significado | Sequência (Texto) | (Nenhum,) | corda | |
referido_alvo | Texto | corda | ||
situação | RecursosDict | |||
situação/direção_do_agente | tensor | int32 | ||
situação/posição_do_agente | RecursosDict | |||
situação/posição_do_agente/coluna | tensor | int32 | ||
situação/posição_do_agente/linha | tensor | int32 | ||
situação/direção_para_alvo | Texto | corda | ||
situação/distance_to_target | tensor | int32 | ||
situação/grid_size | tensor | int32 | ||
situação/objetos_colocados | Seqüência | |||
situação/objetos_colocados/objeto | RecursosDict | |||
situação/objetos_colocados/objeto/cor | Texto | corda | ||
situação/objetos_colocados/objeto/forma | Texto | corda | ||
situação/objetos_colocados/objeto/tamanho | tensor | int32 | ||
situação/objetos_colocados/posição | RecursosDict | |||
situação/objetos_colocados/posição/coluna | tensor | int32 | ||
situação/objetos_colocados/posição/linha | tensor | int32 | ||
situação/objetos_colocados/vetor | Texto | corda | ||
situação/target_object | RecursosDict | |||
situação/objeto_alvo/objeto | RecursosDict | |||
situação/objeto_alvo/objeto/cor | Texto | corda | ||
situação/objeto_alvo/objeto/forma | Texto | corda | ||
situação/target_object/objeto/tamanho | tensor | int32 | ||
situação/target_object/posição | RecursosDict | |||
situação/target_object/posição/coluna | tensor | int32 | ||
situação/target_object/posição/linha | tensor | int32 | ||
situação/target_object/vetor | Texto | corda | ||
target_commands | Sequência (Texto) | (Nenhum,) | corda | |
verb_in_command | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não suportado.
Citação :
@inproceedings{NEURIPS2020_e5a90182,
author = {Ruis, Laura and Andreas, Jacob and Baroni, Marco and Bouchacourt, Diane and Lake, Brenden M},
booktitle = {Advances in Neural Information Processing Systems},
editor = {H. Larochelle and M. Ranzato and R. Hadsell and M. F. Balcan and H. Lin},
pages = {19861--19872},
publisher = {Curran Associates, Inc.},
title = {A Benchmark for Systematic Generalization in Grounded Language Understanding},
url = {https://proceedings.neurips.cc/paper/2020/file/e5a90182cc81e12ab5e72d66e0b46fe3-Paper.pdf},
volume = {33},
year = {2020}
}
@inproceedings{qiu-etal-2021-systematic,
title = "Systematic Generalization on g{SCAN}: {W}hat is Nearly Solved and What is Next?",
author = "Qiu, Linlu and
Hu, Hexiang and
Zhang, Bowen and
Shaw, Peter and
Sha, Fei",
booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2021",
address = "Online and Punta Cana, Dominican Republic",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2021.emnlp-main.166",
doi = "10.18653/v1/2021.emnlp-main.166",
pages = "2180--2188",
}
grounded_scan/compositional_splits (configuração padrão)
Descrição da configuração : Exemplos para generalização composicional.
Tamanho do download :
82.10 MiB
Tamanho do conjunto de dados :
998.11 MiB
Divisões :
Dividir | Exemplos |
---|---|
'adverb_1' | 112.880 |
'adverb_2' | 38.582 |
'contextual' | 11.460 |
'dev' | 3.716 |
'situational_1' | 88.642 |
'situational_2' | 16.808 |
'test' | 19.282 |
'train' | 367.933 |
'visual' | 37.436 |
'visual_easier' | 18.718 |
- Exemplos ( tfds.as_dataframe ):
grounded_scan/target_length_split
Descrição da configuração : Exemplos para generalizar para comprimentos de destino maiores.
Tamanho do download :
53.41 MiB
Tamanho do conjunto de dados :
546.73 MiB
Divisões :
Dividir | Exemplos |
---|---|
'dev' | 1.821 |
'target_lengths' | 198.588 |
'test' | 37.784 |
'train' | 180.301 |
- Exemplos ( tfds.as_dataframe ):
grounded_scan/spatial_relation_splits
Descrição da configuração : Exemplos para raciocínio de relação espacial.
Tamanho do download :
89.59 MiB
Tamanho do conjunto de dados :
675.09 MiB
Divisões :
Dividir | Exemplos |
---|---|
'dev' | 2.617 |
'referent' | 30.492 |
'relation' | 6.285 |
'relative_position_1' | 41.576 |
'relative_position_2' | 41.529 |
'test' | 28.526 |
'train' | 259.088 |
'visual' | 62.250 |
- Exemplos ( tfds.as_dataframe ):