इमेजनेट2012_सबसेट

Imagenet2012Subset मूल ImageNet ILSVRC 2012 डेटासेट का एक सबसेट है। डेटासेट मूल इमेजनेट ILSVRC 2012 डेटासेट के समान सत्यापन सेट को साझा करता है। हालाँकि, प्रशिक्षण सेट को लेबल संतुलित तरीके से सब-सैंपल किया जाता है। 1pct कॉन्फ़िगरेशन में, 1%, या 12811, छवियों का नमूना लिया जाता है, अधिकांश वर्गों में समान संख्या में चित्र होते हैं (औसत 12.8), कुछ वर्गों में यादृच्छिक रूप से दूसरों की तुलना में 1 अधिक उदाहरण होता है; और 10pct विन्यास में, ~10%, या 128116, अधिकांश वर्गों में छवियों की संख्या समान होती है (औसत 128), और कुछ वर्गों में यादृच्छिक रूप से दूसरों की तुलना में 1 अधिक उदाहरण होता है।

यह अर्ध-पर्यवेक्षित सीखने के लिए एक बेंचमार्क के रूप में उपयोग किया जाना चाहिए, और मूल रूप से SimCLR पेपर ( https://arxiv.org/abs/2002.05709 ) में उपयोग किया गया है।

  • होमपेज : http://image-net.org/

  • स्रोत कोड : tfds.datasets.imagenet2012_subset.Builder

  • संस्करण :

    • 2.0.0 : सत्यापन लेबल ठीक करें।
    • 2.0.1 : एन्कोडिंग फिक्स। उपयोगकर्ता के दृष्टिकोण से कोई बदलाव नहीं।
    • 3.0.0 : ~12 छवियों (CMYK -> RGB) पर रंगीकरण ठीक करें। स्थिरता के लिए प्रारूप को ठीक करें (एकल पीएनजी इमेज को जेपीईजी में बदलें)। तेज पीढ़ी सीधे संग्रह से पढ़ रही है।

    • 4.0.0 : (अप्रकाशित)

    • 5.0.0 (डिफ़ॉल्ट): नया स्प्लिट एपीआई ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : जोड़ा गया परीक्षण विभाजन।

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    मैन्युअल_डीआईआर में दो फाइलें होनी चाहिए: ILSVRC2012_img_train.tar और ILSVRC2012_img_val.tar। डेटासेट डाउनलोड करने के लिए लिंक प्राप्त करने के लिए आपको https://image-net.org/download-images पर पंजीकरण करना होगा।

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • फ़ीचर संरचना :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
फ़ाइल का नाम मूलपाठ डोरी
छवि छवि (कोई नहीं, कोई नहीं, 3) uint8
लेबल क्लासलेबल int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िगरेशन विवरण : कुल इमेजनेट प्रशिक्षण सेट का 1pct।

  • डाउनलोड आकार : 254.22 KiB

  • डेटासेट का आकार : 7.61 GiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 12,811
'validation' 50,000

VISUALIZATION

इमेजनेट2012_उपसेट/10pct

  • कॉन्फ़िगरेशन विवरण : कुल इमेजनेट प्रशिक्षण सेट का 10%।

  • डाउनलोड आकार : 2.48 MiB

  • डेटासेट का आकार : 19.91 GiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 128,116
'validation' 50,000

VISUALIZATION