stl10

  • Descripción :

El conjunto de datos STL-10 es un conjunto de datos de reconocimiento de imágenes para desarrollar algoritmos de aprendizaje autodidacta, aprendizaje profundo y aprendizaje de funciones no supervisado. Está inspirado en el conjunto de datos CIFAR-10 pero con algunas modificaciones. En particular, cada clase tiene menos ejemplos de entrenamiento etiquetados que en CIFAR-10, pero se proporciona un conjunto muy grande de ejemplos no etiquetados para aprender modelos de imagen antes del entrenamiento supervisado. El desafío principal es hacer uso de los datos no etiquetados (que provienen de una distribución similar pero diferente de los datos etiquetados) para construir una información previa útil. Todas las imágenes se adquirieron a partir de ejemplos etiquetados en ImageNet.

Separar Ejemplos
'test' 8,000
'train' 5,000
'unlabelled' 100,000
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (96, 96, 3) uint8
etiqueta Etiqueta de clase int64

Visualización

  • Cita :
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}