raisonnement abstrait

l10n-placeholder1 désigne l'ensemble des types de relations (progression, XOR, OR, AND, union cohérente), \\(O\\) désigne les types d'objets (forme, ligne) et \\(A\\) désigne les types d'attributs (taille, couleur, poste, numéro). La structure d'une matrice, \\(S\\), est l'ensemble des triplets \\(S={[r, o, a]}\\) qui déterminent le défi posé par une matrice particulière. Pour utiliser cet ensemble de données : ```python import tensorflow_datasets as tfds ds = tfds.load('abstract_reasoning', split='train') for ex in ds.take(4): print(ex) ``` See [the guide ](https://www.tensorflow.org/datasets/overview) pour plus d'informations sur [tensorflow_datasets](https://www.tensorflow.org/datasets). " />
  • Descriptif :

Les données des matrices générées de manière procédurale (PGM) de l'article Measuring Abstract Reasoning in Neural Networks, Barrett, Hill, Santoro et al. 2018. L'objectif est d'inférer la bonne réponse à partir des panneaux de contexte sur la base d'un raisonnement abstrait.

Pour utiliser cet ensemble de données, veuillez télécharger tous les fichiers *.tar.gz à partir de la page de l'ensemble de données et placez-les dans ~/tensorflow_datasets/abstract_reasoning/.

\(R\) désigne l'ensemble des types de relations (progression, XOR, OR, AND, union cohérente), \(O\) désigne les types d'objets (forme, ligne) et \(A\) désigne les types d'attributs (taille, couleur, position, Numéro). La structure d'une matrice,\(S\), est l'ensemble de triplets \(S={[r, o, a]}\) qui déterminent le défi posé par une matrice particulière.

Diviser Exemples
'test' 200 000
'train' 1 200 000
'validation' 20 000
  • Structure des fonctionnalités :
FeaturesDict({
    'answers': Video(Image(shape=(160, 160, 1), dtype=uint8)),
    'context': Video(Image(shape=(160, 160, 1), dtype=uint8)),
    'filename': Text(shape=(), dtype=string),
    'meta_target': Tensor(shape=(12,), dtype=int64),
    'relation_structure_encoded': Tensor(shape=(4, 12), dtype=int64),
    'target': ClassLabel(shape=(), dtype=int64, num_classes=8),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
réponses Vidéo (Image) (8, 160, 160, 1) uint8
le contexte Vidéo (Image) (8, 160, 160, 1) uint8
nom de fichier Texte chaîne de caractères
meta_target Tenseur (12,) int64
relation_structure_encoding Tenseur (4, 12) int64
cible Étiquette de classe int64
@InProceedings{pmlr-v80-barrett18a,
  title =    {Measuring abstract reasoning in neural networks},
  author =   {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
  booktitle =    {Proceedings of the 35th International Conference on Machine Learning},
  pages =    {511--520},
  year =     {2018},
  editor =   {Dy, Jennifer and Krause, Andreas},
  volume =   {80},
  series =   {Proceedings of Machine Learning Research},
  address =      {Stockholmsmassan, Stockholm Sweden},
  month =    {10--15 Jul},
  publisher =    {PMLR},
  pdf =      {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
  url =      {http://proceedings.mlr.press/v80/barrett18a.html},
  abstract =     {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}

abstract_reasoning/neutre (configuration par défaut)

  • Description de la configuration : Les structures encodant les matrices à la fois dans
    les ensembles d'entraînement et de test contiennent tous les triplets \([r, o, a]\) pour \(r \\in R\),
    \(o \\in O\)et \(a \\in A\). Les ensembles d'entraînement et de test sont disjoints, avec
    séparation se produisant au niveau des variables d'entrée (ie pixel
    manifestations).

  • Taille du jeu de données : 42.02 GiB

  • Exemples ( tfds.as_dataframe ):

raisonnement_abstrait/interpolation

  • Description de la configuration : comme dans le partage neutre, \(S\) était composé de n'importe quel
    triple \([r, o, a]\). Pour l'interpolation, dans l'ensemble d'apprentissage, lorsque le
    était "couleur" ou "taille" (c'est-à-dire les attributs ordonnés), les valeurs de
    les attributs étaient limités aux membres pairs d'un ensemble discret,
    alors que dans l'ensemble de test, seules les valeurs indexées impaires étaient autorisées. Notez que tout
    \(S\) contenait un triple \([r, o, a]\) avec l'attribut color ou size .
    Ainsi, la généralisation est requise pour chaque question de l'ensemble de test.

  • Taille du jeu de données : 37.09 GiB

  • Exemples ( tfds.as_dataframe ):

raisonnement_abstrait/extrapolation

  • Description de la configuration : Identique à l'interpolation, mais les valeurs de
    les attributs ont été limités à la moitié inférieure de l'ensemble discret pendant
    formation, alors que dans l'ensemble de test, ils ont pris des valeurs dans la moitié supérieure.

  • Taille du jeu de données : 35.91 GiB

  • Exemples ( tfds.as_dataframe ):

raisonnement_abstrait/attr.rel.pairs

  • Description de la configuration : Tous \(S\) contenaient au moins deux triplets,
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\), dont 400 sont viables. Nous
    attribués au hasard 360 à l'ensemble d'apprentissage et 40 à l'ensemble de test. Membres
    \((t_1, t_2)\) des 40 paires retenues n'apparaissaient pas ensemble dans les structures\(S\)
    dans l'ensemble d'apprentissage, et toutes les structures \(S\) avaient au moins une telle paire
    \((t_1, t_2)\) en tant que sous-ensemble.

  • Taille du jeu de données : 41.07 GiB

  • Exemples ( tfds.as_dataframe ):

raisonnement_abstrait/attr.rels

  • Description de la configuration : dans notre jeu de données, il existe 29 éléments uniques possibles.
    triple \([r,o,a]\). Nous en avons attribué sept pour l'ensemble de test, au hasard,
    mais tel que chacun des attributs était représenté exactement une fois dans cet ensemble.
    Ces triplets retenus ne se sont jamais produits dans les questions de l'ensemble de formation, et
    chaque \(S\) de l'ensemble de test en contenait au moins un.

  • Taille du jeu de données : 41.45 GiB

  • Exemples ( tfds.as_dataframe ):

raisonnement_abstrait/attrs.pairs

  • Description de la configuration : \(S\) contenait au moins deux triplets. Il y a 20
    paires d'attributs viables (non ordonnées) \((a_1, a_2)\) telles que pour certains
    \(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) est une triple paire viable
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). Nous avons attribué 16 de ces paires
    pour la formation et quatre pour les tests. Pour une paire \((a_1, a_2)\) dans le jeu de test,
    \(S\) dans l'ensemble d'apprentissage contenait des triplets avec \(a_1\) ou \(a_2\). Dans l'épreuve
    ensemble, tous \(S\) contenaient des triplets avec \(a_1\) et \(a_2\).

  • Taille du jeu de données : 40.98 GiB

  • Exemples ( tfds.as_dataframe ):

raisonnement_abstrait/attrs.shape.color

  • Description de la configuration : Attribut shape-color tenu en attente. \(S\) in
    l'ensemble d'apprentissage ne contenait pas de triplets avec \(o\)=forme et \(a\)=couleur.
    Toutes les structures régissant les puzzles dans l'ensemble de test contenaient au moins un triple
    avec \(o\)=forme et \(a\)=couleur.

  • Taille du jeu de données : 41.21 GiB

  • Exemples ( tfds.as_dataframe ):

abstract_reasoning/attrs.line.type

  • Description de la configuration : type de ligne d'attribut suspendu. \(S\) dans
    l'ensemble d'apprentissage ne contenait pas de triplets avec \(o\)=line et \(a\)=type.
    Toutes les structures régissant les puzzles dans l'ensemble de test contenaient au moins un triple
    avec \(o\)=ligne et \(a\)=type.

  • Taille du jeu de données : 41.40 GiB

  • Exemples ( tfds.as_dataframe ):