cifar10_1

مجموعه داده CIFAR-10.1 یک مجموعه آزمایشی جدید برای CIFAR-10 است. CIFAR-10.1 شامل تقریباً 2000 تصویر آزمایشی جدید است که پس از چندین سال تحقیق روی مجموعه داده اصلی CIFAR-10 نمونه برداری شده است. مجموعه داده ها برای CIFAR-10.1 برای به حداقل رساندن تغییر توزیع نسبت به مجموعه داده اصلی طراحی شده است. ما ایجاد CIFAR-10.1 را در مقاله "آیا طبقه بندی کننده های CIFAR-10 به CIFAR-10 تعمیم می دهند؟" توضیح می دهیم. تصاویر موجود در CIFAR-10.1 زیرمجموعه ای از مجموعه داده TinyImages هستند. در حال حاضر دو نسخه از مجموعه داده CIFAR-10.1 وجود دارد: v4 و v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تصویر تصویر (32، 32، 3) uint8
برچسب ClassLabel int64
  • کلیدهای نظارت شده (مشاهده as_supervised doc ): ('image', 'label')

  • نقل قول :

@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (پیکربندی پیش فرض)

  • توضیحات پیکربندی : این اولین نسخه از مجموعه داده ما است که ما هر طبقه‌بندی کننده را روی آن آزمایش کردیم. همانطور که در بالا ذکر شد، این باعث می شود مجموعه داده v4 از طبقه بندی کننده هایی که ارزیابی می کنیم مستقل باشد. اعداد گزارش شده در بخش های اصلی مقاله ما از این نسخه از مجموعه داده استفاده می کنند. این از 25 کلمه کلیدی TinyImages برتر برای هر کلاس ساخته شده بود که منجر به عدم تعادل کلاسی جزئی شد. بزرگترین تفاوت این است که کشتی ها به جای 10 درصد، تنها 8 درصد از مجموعه آزمایشی را تشکیل می دهند. نسخه 4 شامل 2021 تصویر است.

  • حجم دانلود : 5.93 MiB

  • حجم مجموعه داده : 4.46 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 2021

تجسم

cifar10_1/v6

  • توضیحات پیکربندی : از یک تخصیص کمی بهبود یافته کلیدواژه که دقیقاً با کلاس متعادل است مشتق شده است. این نسخه از مجموعه داده با نتایج ضمیمه D مقاله ما مطابقت دارد. v6 شامل 2000 تصویر است.

  • حجم دانلود : 5.87 MiB

  • حجم مجموعه داده : 4.40 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 2000

تجسم