सिफार10_1

CIFAR-10.1 डेटासेट CIFAR-10 के लिए एक नया परीक्षण सेट है। CIFAR-10.1 में लगभग 2,000 नए परीक्षण चित्र शामिल हैं जिन्हें मूल CIFAR-10 डेटासेट पर कई वर्षों के शोध के बाद नमूना लिया गया था। CIFAR-10.1 के लिए डेटा संग्रह मूल डेटासेट के सापेक्ष वितरण बदलाव को कम करने के लिए डिज़ाइन किया गया था। हम पेपर में CIFAR-10.1 के निर्माण का वर्णन करते हैं "Do CIFAR-10 Classifiers Generalize to CIFAR-10?"। CIFAR-10.1 में छवियां TinyImages डेटासेट का एक सबसेट हैं। वर्तमान में CIFAR-10.1 डेटासेट के दो संस्करण हैं: v4 और v6।

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
छवि छवि (32, 32, 3) uint8
लेबल क्लासलेबल int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िगरेशन विवरण : यह हमारे डेटासेट का पहला संस्करण है जिस पर हमने किसी क्लासिफायर का परीक्षण किया। जैसा कि ऊपर उल्लेख किया गया है, यह v4 डेटासेट को हमारे द्वारा मूल्यांकन किए जाने वाले क्लासिफायर से स्वतंत्र बनाता है। हमारे पेपर के मुख्य भाग में रिपोर्ट की गई संख्याएँ डेटासेट के इस संस्करण का उपयोग करती हैं। इसे प्रत्येक वर्ग के लिए शीर्ष 25 TinyImages कीवर्ड से बनाया गया था, जिसके कारण वर्ग में थोड़ा सा असंतुलन हो गया था। सबसे बड़ा अंतर यह है कि जहाज 10% के बजाय केवल 8% परीक्षण सेट बनाते हैं। v4 में 2,021 चित्र हैं।

  • डाउनलोड आकार : 5.93 MiB

  • डेटासेट का आकार : 4.46 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,021

VISUALIZATION

सिफर10_1/v6

  • Config विवरण : यह थोड़ा सुधारित कीवर्ड आवंटन से लिया गया है जो बिल्कुल वर्ग संतुलित है। डेटासेट का यह संस्करण हमारे पेपर के परिशिष्ट डी के परिणामों से मेल खाता है। v6 में 2,000 चित्र हैं।

  • डाउनलोड आकार : 5.87 MiB

  • डेटासेट का आकार : 4.40 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 2,000

VISUALIZATION