CIFAR-10.1 डेटासेट CIFAR-10 के लिए एक नया परीक्षण सेट है। CIFAR-10.1 में लगभग 2,000 नए परीक्षण चित्र शामिल हैं जिन्हें मूल CIFAR-10 डेटासेट पर कई वर्षों के शोध के बाद नमूना लिया गया था। CIFAR-10.1 के लिए डेटा संग्रह मूल डेटासेट के सापेक्ष वितरण बदलाव को कम करने के लिए डिज़ाइन किया गया था। हम पेपर में CIFAR-10.1 के निर्माण का वर्णन करते हैं "Do CIFAR-10 Classifiers Generalize to CIFAR-10?"। CIFAR-10.1 में छवियां TinyImages डेटासेट का एक सबसेट हैं। वर्तमान में CIFAR-10.1 डेटासेट के दो संस्करण हैं: v4 और v6।
स्रोत कोड :
tfds.image_classification.Cifar10_1
संस्करण :
-
1.1.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
फ़ीचर संरचना :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
छवि | छवि | (32, 32, 3) | uint8 | |
लेबल | क्लासलेबल | int64 |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('image', 'label')
उद्धरण :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (डिफ़ॉल्ट कॉन्फ़िगरेशन)
कॉन्फ़िगरेशन विवरण : यह हमारे डेटासेट का पहला संस्करण है जिस पर हमने किसी क्लासिफायर का परीक्षण किया। जैसा कि ऊपर उल्लेख किया गया है, यह v4 डेटासेट को हमारे द्वारा मूल्यांकन किए जाने वाले क्लासिफायर से स्वतंत्र बनाता है। हमारे पेपर के मुख्य भाग में रिपोर्ट की गई संख्याएँ डेटासेट के इस संस्करण का उपयोग करती हैं। इसे प्रत्येक वर्ग के लिए शीर्ष 25 TinyImages कीवर्ड से बनाया गया था, जिसके कारण वर्ग में थोड़ा सा असंतुलन हो गया था। सबसे बड़ा अंतर यह है कि जहाज 10% के बजाय केवल 8% परीक्षण सेट बनाते हैं। v4 में 2,021 चित्र हैं।
डाउनलोड आकार :
5.93 MiB
डेटासेट का आकार :
4.46 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,021 |
- चित्र ( tfds.show_examples ):
- उदाहरण ( tfds.as_dataframe ):
सिफर10_1/v6
Config विवरण : यह थोड़ा सुधारित कीवर्ड आवंटन से लिया गया है जो बिल्कुल वर्ग संतुलित है। डेटासेट का यह संस्करण हमारे पेपर के परिशिष्ट डी के परिणामों से मेल खाता है। v6 में 2,000 चित्र हैं।
डाउनलोड आकार :
5.87 MiB
डेटासेट का आकार :
4.40 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 2,000 |
- चित्र ( tfds.show_examples ):
- उदाहरण ( tfds.as_dataframe ):