cifar10_1

CIFAR-10.1 ডেটাসেট হল CIFAR-10-এর জন্য একটি নতুন পরীক্ষা সেট। CIFAR-10.1-এ মোটামুটি 2,000টি নতুন পরীক্ষার ছবি রয়েছে যেগুলি মূল CIFAR-10 ডেটাসেটের উপর একাধিক বছরের গবেষণার পরে নমুনা করা হয়েছিল। CIFAR-10.1-এর ডেটা সংগ্রহ মূল ডেটাসেটের তুলনায় বন্টন স্থানান্তর কমানোর জন্য ডিজাইন করা হয়েছিল। আমরা কাগজে CIFAR-10.1 তৈরির বর্ণনা দিই "CIFAR-10 ক্লাসিফায়ারগুলি কি CIFAR-10-এ সাধারণীকরণ করে?"। CIFAR-10.1-এর ছবিগুলি হল TinyImages ডেটাসেটের একটি উপসেট৷ বর্তমানে CIFAR-10.1 ডেটাসেটের দুটি সংস্করণ রয়েছে: v4 এবং v6৷

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
ইমেজ ছবি (৩২, ৩২, ৩) tf.uint8
লেবেল ক্লাসলেবেল tf.int64
  • তত্ত্বাবধানে থাকা কী ( as_supervised doc ): ('image', 'label')

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদাহরণ ( tfds.as_dataframe ): অনুপস্থিত।

  • উদ্ধৃতি :

@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (ডিফল্ট কনফিগারেশন)

  • কনফিগারেশনের বিবরণ : এটি আমাদের ডেটাসেটের প্রথম সংস্করণ যার উপর আমরা কোনো ক্লাসিফায়ার পরীক্ষা করেছি। উপরে উল্লিখিত হিসাবে, এটি v4 ডেটাসেটকে আমাদের মূল্যায়ন করা ক্লাসিফায়ারের থেকে স্বাধীন করে তোলে। আমাদের কাগজের প্রধান বিভাগে রিপোর্ট করা সংখ্যাগুলি ডেটাসেটের এই সংস্করণটি ব্যবহার করে। এটি প্রতিটি ক্লাসের জন্য শীর্ষ 25 টি টিনিইমেজ কীওয়ার্ড থেকে তৈরি করা হয়েছিল, যা একটি সামান্য শ্রেণী ভারসাম্যহীনতার দিকে পরিচালিত করেছিল। সবচেয়ে বড় পার্থক্য হল যে জাহাজগুলি 10% এর পরিবর্তে পরীক্ষা সেটের মাত্র 8% তৈরি করে। v4 তে 2,021টি ছবি রয়েছে।

  • ডাউনলোডের আকার : 5.93 MiB

  • ডেটাসেটের আকার : 4.46 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 2,021

cifar10_1/v6

  • কনফিগারের বিবরণ : এটি একটি সামান্য উন্নত কীওয়ার্ড বরাদ্দ থেকে উদ্ভূত যা ঠিক শ্রেণী ভারসাম্যপূর্ণ। ডেটাসেটের এই সংস্করণটি আমাদের কাগজের পরিশিষ্ট D-এর ফলাফলের সাথে মিলে যায়। v6 তে 2,000টি ছবি রয়েছে।

  • ডাউনলোড সাইজ : 5.87 MiB

  • ডেটাসেটের আকার : 4.40 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 2,000