imagenet2012_subset

  • Descripción :

Imagenet2012Subset es un subconjunto del conjunto de datos original de ImageNet ILSVRC 2012. El conjunto de datos comparte el mismo conjunto de validación que el conjunto de datos ImageNet ILSVRC 2012 original. Sin embargo, el conjunto de entrenamiento se submuestrea de forma equilibrada con etiquetas. En la configuración 1pct , se muestrean 1% o 12811 imágenes, la mayoría de las clases tienen la misma cantidad de imágenes (promedio 12,8), algunas clases tienen aleatoriamente 1 ejemplo más que otras; y en una configuración 10pct , ~10%, o 128116, la mayoría de las clases tienen la misma cantidad de imágenes (promedio 128) y algunas clases tienen aleatoriamente 1 ejemplo más que otras.

Se supone que esto se utiliza como punto de referencia para el aprendizaje semisupervisado y se utilizó originalmente en el artículo SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Página de inicio : http://image-net.org/

  • Código fuente : tfds.datasets.imagenet2012_subset.Builder

  • Versiones :

    • 2.0.0 : corrige las etiquetas de validación.
    • 2.0.1 : corrección de codificación. No hay cambios desde el punto de vista del usuario.
    • 3.0.0 : Corrige la coloración en ~12 imágenes (CMYK -> RGB). Corrige el formato para mantener la coherencia (convierte la única imagen png a Jpeg). Lectura de generación más rápida directamente desde el archivo.

    • 4.0.0 : (inédito)

    • 5.0.0 (predeterminado): Nueva API dividida ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : División de prueba agregada.

  • Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en download_config.manual_dir (el valor predeterminado es ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Debe registrarse en https://image-net.org/download-images para obtener el enlace para descargar el conjunto de datos.

  • Almacenamiento en caché automático ( documentación ): No

  • Estructura de características :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
Nombre del archivo Texto cadena
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (configuración predeterminada)

  • Descripción de la configuración : 1 unidad del conjunto de entrenamiento total de ImageNet.

  • Tamaño de descarga : 254.22 KiB

  • Tamaño del conjunto de datos : 7.61 GiB

  • Divisiones :

Dividir Ejemplos
'train' 12.811
'validation' 50.000

Visualización

imagenet2012_subset/10pct

  • Descripción de la configuración : 10% del conjunto total de entrenamiento de ImageNet.

  • Tamaño de descarga : 2.48 MiB

  • Tamaño del conjunto de datos : 19.91 GiB

  • Divisiones :

Dividir Ejemplos
'train' 128,116
'validation' 50.000

Visualización