stl10

  • Descriptif :

L'ensemble de données STL-10 est un ensemble de données de reconnaissance d'images pour le développement d'algorithmes d'apprentissage de caractéristiques non supervisé, d'apprentissage en profondeur et d'apprentissage autodidacte. Il est inspiré du jeu de données CIFAR-10 mais avec quelques modifications. En particulier, chaque classe a moins d'exemples de formation étiquetés que dans CIFAR-10, mais un très grand nombre d'exemples non étiquetés est fourni pour apprendre des modèles d'image avant la formation supervisée. Le principal défi consiste à utiliser les données non étiquetées (qui proviennent d'une distribution similaire mais différente des données étiquetées) pour construire un a priori utile. Toutes les images ont été acquises à partir d'exemples étiquetés sur ImageNet.

Diviser Exemples
'test' 8 000
'train' 5 000
'unlabelled' 100 000
  • Structure des fonctionnalités :
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
image Image (96, 96, 3) uint8
étiquette Étiquette de classe int64

Visualisation

  • Citation :
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}