imagenet2012_sottoinsieme

Imagenet2012Subset è un sottoinsieme del set di dati ImageNet ILSVRC 2012 originale. Il set di dati condivide lo stesso set di convalida del set di dati ImageNet ILSVRC 2012 originale. Tuttavia, il set di addestramento è sottoposto a sottocampionamento in modo bilanciato dall'etichetta. Nella configurazione 1pct , 1% o 12811, le immagini vengono campionate, la maggior parte delle classi ha lo stesso numero di immagini (media 12,8), alcune classi hanno casualmente 1 esempio in più rispetto ad altre; e nella configurazione 10pct , ~10% o 128116, la maggior parte delle classi ha lo stesso numero di immagini (in media 128) e alcune classi hanno casualmente 1 esempio in più rispetto ad altre.

Questo dovrebbe essere utilizzato come punto di riferimento per l'apprendimento semi-supervisionato ed è stato originariamente utilizzato nel documento SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Pagina iniziale : http://image-net.org/

  • Codice sorgente : tfds.datasets.imagenet2012_subset.Builder

  • Versioni :

    • 2.0.0 : correzione delle etichette di convalida.
    • 2.0.1 : correzione della codifica. Nessuna modifica dal punto di vista dell'utente.
    • 3.0.0 : correzione della colorazione su ~ 12 immagini (CMYK -> RGB). Correggi il formato per coerenza (converti la singola immagine png in Jpeg). Generazione più rapida lettura direttamente dall'archivio.

    • 4.0.0 : (non pubblicato)

    • 5.0.0 (impostazione predefinita): nuova API divisa ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Aggiunta divisione test.

  • Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in download_config.manual_dir (il valore predefinito è ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir dovrebbe contenere due file: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. È necessario registrarsi su https://image-net.org/download-images per ottenere il collegamento per scaricare il set di dati.

  • Cache automatica ( documentazione ): No

  • Struttura delle caratteristiche :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
nome del file Testo corda
Immagine Immagine (Nessuno, Nessuno, 3) uint8
etichetta ClassLabel int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (configurazione predefinita)

  • Descrizione della configurazione : 1% del set di formazione totale di ImageNet.

  • Dimensione del download : 254.22 KiB

  • Dimensione del set di dati : 7.61 GiB

  • Divisioni :

Diviso Esempi
'train' 12.811
'validation' 50.000

Visualizzazione

imagenet2012_subset/10%

  • Descrizione della configurazione : 10% del set di formazione totale di ImageNet.

  • Dimensione del download : 2.48 MiB

  • Dimensione del set di dati : 19.91 GiB

  • Divisioni :

Diviso Esempi
'train' 128,116
'validation' 50.000

Visualizzazione