- Descriptif :
Les données des matrices générées de manière procédurale (PGM) de l'article Measuring Abstract Reasoning in Neural Networks, Barrett, Hill, Santoro et al. 2018. L'objectif est d'inférer la bonne réponse à partir des panneaux de contexte sur la base d'un raisonnement abstrait.
Pour utiliser cet ensemble de données, veuillez télécharger tous les fichiers *.tar.gz à partir de la page de l'ensemble de données et placez-les dans ~/tensorflow_datasets/abstract_reasoning/.
\(R\) désigne l'ensemble des types de relations (progression, XOR, OR, AND, union cohérente), \(O\) désigne les types d'objets (forme, ligne) et \(A\) désigne les types d'attributs (taille, couleur, position, Numéro). La structure d'une matrice,\(S\), est l'ensemble de triplets \(S={[r, o, a]}\) qui déterminent le défi posé par une matrice particulière.
Documentation complémentaire : Explorer sur Papers With Code
Page d'accueil : https://github.com/deepmind/abstract-reasoning-matrices
Code source :
tfds.datasets.abstract_reasoning.Builder
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
Unknown size
Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données source dans
download_config.manual_dir
(par défaut,~/tensorflow_datasets/downloads/manual/
) :
Les données peuvent être téléchargées à partir de https://console.cloud.google.com/storage/browser/ravens-matrices Veuillez mettre tous les fichiers tar.gz dans manual_dir.Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 200 000 |
'train' | 1 200 000 |
'validation' | 20 000 |
- Structure des fonctionnalités :
FeaturesDict({
'answers': Video(Image(shape=(160, 160, 1), dtype=uint8)),
'context': Video(Image(shape=(160, 160, 1), dtype=uint8)),
'filename': Text(shape=(), dtype=string),
'meta_target': Tensor(shape=(12,), dtype=int64),
'relation_structure_encoded': Tensor(shape=(4, 12), dtype=int64),
'target': ClassLabel(shape=(), dtype=int64, num_classes=8),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
réponses | Vidéo (Image) | (8, 160, 160, 1) | uint8 | |
le contexte | Vidéo (Image) | (8, 160, 160, 1) | uint8 | |
nom de fichier | Texte | chaîne de caractères | ||
meta_target | Tenseur | (12,) | int64 | |
relation_structure_encoding | Tenseur | (4, 12) | int64 | |
cible | Étiquette de classe | int64 |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@InProceedings{pmlr-v80-barrett18a,
title = {Measuring abstract reasoning in neural networks},
author = {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
booktitle = {Proceedings of the 35th International Conference on Machine Learning},
pages = {511--520},
year = {2018},
editor = {Dy, Jennifer and Krause, Andreas},
volume = {80},
series = {Proceedings of Machine Learning Research},
address = {Stockholmsmassan, Stockholm Sweden},
month = {10--15 Jul},
publisher = {PMLR},
pdf = {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
url = {http://proceedings.mlr.press/v80/barrett18a.html},
abstract = {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}
abstract_reasoning/neutre (configuration par défaut)
Description de la configuration : Les structures encodant les matrices à la fois dans
les ensembles d'entraînement et de test contiennent tous les triplets \([r, o, a]\) pour \(r \\in R\),
\(o \\in O\)et \(a \\in A\). Les ensembles d'entraînement et de test sont disjoints, avec
séparation se produisant au niveau des variables d'entrée (ie pixel
manifestations).Taille du jeu de données :
42.02 GiB
Exemples ( tfds.as_dataframe ):
raisonnement_abstrait/interpolation
Description de la configuration : comme dans le partage neutre, \(S\) était composé de n'importe quel
triple \([r, o, a]\). Pour l'interpolation, dans l'ensemble d'apprentissage, lorsque le
était "couleur" ou "taille" (c'est-à-dire les attributs ordonnés), les valeurs de
les attributs étaient limités aux membres pairs d'un ensemble discret,
alors que dans l'ensemble de test, seules les valeurs indexées impaires étaient autorisées. Notez que tout
\(S\) contenait un triple \([r, o, a]\) avec l'attribut color ou size .
Ainsi, la généralisation est requise pour chaque question de l'ensemble de test.Taille du jeu de données :
37.09 GiB
Exemples ( tfds.as_dataframe ):
raisonnement_abstrait/extrapolation
Description de la configuration : Identique à l'interpolation, mais les valeurs de
les attributs ont été limités à la moitié inférieure de l'ensemble discret pendant
formation, alors que dans l'ensemble de test, ils ont pris des valeurs dans la moitié supérieure.Taille du jeu de données :
35.91 GiB
Exemples ( tfds.as_dataframe ):
raisonnement_abstrait/attr.rel.pairs
Description de la configuration : Tous \(S\) contenaient au moins deux triplets,
\(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\), dont 400 sont viables. Nous
attribués au hasard 360 à l'ensemble d'apprentissage et 40 à l'ensemble de test. Membres
\((t_1, t_2)\) des 40 paires retenues n'apparaissaient pas ensemble dans les structures\(S\)
dans l'ensemble d'apprentissage, et toutes les structures \(S\) avaient au moins une telle paire
\((t_1, t_2)\) en tant que sous-ensemble.Taille du jeu de données :
41.07 GiB
Exemples ( tfds.as_dataframe ):
raisonnement_abstrait/attr.rels
Description de la configuration : dans notre jeu de données, il existe 29 éléments uniques possibles.
triple \([r,o,a]\). Nous en avons attribué sept pour l'ensemble de test, au hasard,
mais tel que chacun des attributs était représenté exactement une fois dans cet ensemble.
Ces triplets retenus ne se sont jamais produits dans les questions de l'ensemble de formation, et
chaque \(S\) de l'ensemble de test en contenait au moins un.Taille du jeu de données :
41.45 GiB
Exemples ( tfds.as_dataframe ):
raisonnement_abstrait/attrs.pairs
Description de la configuration : \(S\) contenait au moins deux triplets. Il y a 20
paires d'attributs viables (non ordonnées) \((a_1, a_2)\) telles que pour certains
\(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) est une triple paire viable
\(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). Nous avons attribué 16 de ces paires
pour la formation et quatre pour les tests. Pour une paire \((a_1, a_2)\) dans le jeu de test,
\(S\) dans l'ensemble d'apprentissage contenait des triplets avec \(a_1\) ou \(a_2\). Dans l'épreuve
ensemble, tous \(S\) contenaient des triplets avec \(a_1\) et \(a_2\).Taille du jeu de données :
40.98 GiB
Exemples ( tfds.as_dataframe ):
raisonnement_abstrait/attrs.shape.color
Description de la configuration : Attribut shape-color tenu en attente. \(S\) in
l'ensemble d'apprentissage ne contenait pas de triplets avec \(o\)=forme et \(a\)=couleur.
Toutes les structures régissant les puzzles dans l'ensemble de test contenaient au moins un triple
avec \(o\)=forme et \(a\)=couleur.Taille du jeu de données :
41.21 GiB
Exemples ( tfds.as_dataframe ):
abstract_reasoning/attrs.line.type
Description de la configuration : type de ligne d'attribut suspendu. \(S\) dans
l'ensemble d'apprentissage ne contenait pas de triplets avec \(o\)=line et \(a\)=type.
Toutes les structures régissant les puzzles dans l'ensemble de test contenaient au moins un triple
avec \(o\)=ligne et \(a\)=type.Taille du jeu de données :
41.40 GiB
Exemples ( tfds.as_dataframe ):