सिफार10_1

CIFAR-10.1 डेटासेट CIFAR-10 के लिए एक नया परीक्षण सेट है। CIFAR-10.1 में लगभग 2,000 नई परीक्षण छवियां शामिल हैं जिन्हें मूल CIFAR-10 डेटासेट पर कई वर्षों के शोध के बाद नमूना लिया गया था। CIFAR-10.1 के लिए डेटा संग्रह को मूल डेटासेट के सापेक्ष वितरण बदलाव को कम करने के लिए डिज़ाइन किया गया था। हम CIFAR-10.1 के निर्माण का वर्णन "Do CIFAR-10 Classifiers Generalize to CIFAR-10?" पेपर में करते हैं। CIFAR-10.1 में छवियां TinyImages डेटासेट का सबसेट हैं। वर्तमान में CIFAR-10.1 डेटासेट के दो संस्करण हैं: v4 और v6।

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएंडिक्ट
छवि छवि (32, 32, 3) tf.uint8
लेबल क्लासलेबल tf.int64
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): ('image', 'label')

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उदाहरण ( tfds.as_dataframe ): मौजूद नहीं है।

  • उद्धरण :

@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (डिफ़ॉल्ट कॉन्फ़िग)

  • कॉन्फ़िगरेशन विवरण : यह हमारे डेटासेट का पहला संस्करण है जिस पर हमने किसी भी क्लासिफायर का परीक्षण किया है। जैसा कि ऊपर उल्लेख किया गया है, यह v4 डेटासेट को हमारे द्वारा मूल्यांकन किए जाने वाले क्लासिफायर से स्वतंत्र बनाता है। हमारे पेपर के मुख्य भाग में रिपोर्ट किए गए नंबर डेटासेट के इस संस्करण का उपयोग करते हैं। यह प्रत्येक वर्ग के लिए शीर्ष 25 TinyImages कीवर्ड से बनाया गया था, जिसके कारण थोड़ा सा वर्ग असंतुलन हुआ। सबसे बड़ा अंतर यह है कि जहाज 10% के बजाय परीक्षण सेट का केवल 8% बनाते हैं। v4 में 2,021 चित्र हैं।

  • डाउनलोड साइज : 5.93 MiB

  • डेटासेट का आकार : 4.46 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,021

सिफार10_1/v6

  • कॉन्फिग विवरण : यह थोड़ा बेहतर कीवर्ड आवंटन से लिया गया है जो बिल्कुल संतुलित वर्ग है। डेटासेट का यह संस्करण हमारे पेपर के परिशिष्ट D के परिणामों से मेल खाता है। v6 में 2,000 छवियां हैं।

  • डाउनलोड आकार : 5.87 MiB

  • डेटासेट का आकार : 4.40 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,000