- شرح :
مجموعه داده CIFAR-10.1 یک مجموعه آزمایشی جدید برای CIFAR-10 است. CIFAR-10.1 شامل تقریباً 2000 تصویر آزمایشی جدید است که پس از چندین سال تحقیق روی مجموعه داده اصلی CIFAR-10 نمونه برداری شده است. مجموعه داده ها برای CIFAR-10.1 برای به حداقل رساندن تغییر توزیع نسبت به مجموعه داده اصلی طراحی شده است. ما ایجاد CIFAR-10.1 را در مقاله "آیا طبقه بندی کننده های CIFAR-10 به CIFAR-10 تعمیم می دهند؟" توضیح می دهیم. تصاویر موجود در CIFAR-10.1 زیرمجموعه ای از مجموعه داده TinyImages هستند. در حال حاضر دو نسخه از مجموعه داده CIFAR-10.1 وجود دارد: v4 و v6.
صفحه اصلی : https://github.com/modestyachts/CIFAR-10.1
کد منبع :
tfds.image_classification.Cifar10_1
نسخه ها :
-
1.1.0
(پیش فرض): بدون یادداشت انتشار.
-
ذخیره خودکار ( اسناد ): بله
ساختار ویژگی :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
تصویر | تصویر | (32، 32، 3) | uint8 | |
برچسب | ClassLabel | int64 |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('image', 'label')
نقل قول :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (پیکربندی پیش فرض)
توضیحات پیکربندی : این اولین نسخه از مجموعه داده ما است که ما هر طبقهبندی کننده را روی آن آزمایش کردیم. همانطور که در بالا ذکر شد، این باعث می شود مجموعه داده v4 از طبقه بندی کننده هایی که ارزیابی می کنیم مستقل باشد. اعداد گزارش شده در بخش های اصلی مقاله ما از این نسخه از مجموعه داده استفاده می کنند. این از 25 کلمه کلیدی TinyImages برتر برای هر کلاس ساخته شده بود که منجر به عدم تعادل کلاسی جزئی شد. بزرگترین تفاوت این است که کشتی ها به جای 10 درصد، تنها 8 درصد از مجموعه آزمایشی را تشکیل می دهند. نسخه 4 شامل 2021 تصویر است.
حجم دانلود :
5.93 MiB
حجم مجموعه داده :
4.46 MiB
تقسیمات :
شکاف | مثال ها |
---|---|
'test' | 2021 |
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
cifar10_1/v6
توضیحات پیکربندی : از یک تخصیص کمی بهبود یافته کلیدواژه که دقیقاً با کلاس متعادل است مشتق شده است. این نسخه از مجموعه داده با نتایج ضمیمه D مقاله ما مطابقت دارد. v6 شامل 2000 تصویر است.
حجم دانلود :
5.87 MiB
حجم مجموعه داده :
4.40 MiB
تقسیمات :
شکاف | مثال ها |
---|---|
'test' | 2000 |
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):