imagenet2012_subset

  • وصف :

Imagenet2012Subset هي مجموعة فرعية من مجموعة بيانات ImageNet ILSVRC 2012 الأصلية. تشترك مجموعة البيانات في نفس مجموعة التحقق من الصحة مثل مجموعة بيانات ImageNet ILSVRC 2012 الأصلية. ومع ذلك، يتم أخذ عينات فرعية من مجموعة التدريب بطريقة متوازنة. في تكوين 1pct ، 1%، أو 12811، يتم أخذ عينات من الصور، ومعظم الفئات لها نفس عدد الصور (المتوسط ​​12.8)، وبعض الفئات تحتوي بشكل عشوائي على مثال واحد أكثر من غيرها؛ وفي تكوين 10pct ، ~10%، أو 128116، تحتوي معظم الفئات على نفس عدد الصور (128 في المتوسط)، وبعض الفئات تحتوي بشكل عشوائي على مثال واحد أكثر من غيرها.

من المفترض أن يتم استخدامه كمعيار للتعلم شبه الخاضع للإشراف، وقد تم استخدامه في الأصل في ورقة SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • الصفحة الرئيسية : http://image-net.org/

  • كود المصدر : tfds.datasets.imagenet2012_subset.Builder

  • الإصدارات :

    • 2.0.0 : إصلاح تسميات التحقق من الصحة.
    • 2.0.1 : إصلاح الترميز. لا توجد تغييرات من وجهة نظر المستخدم.
    • 3.0.0 : إصلاح التلوين على 12 صورة تقريبًا (CMYK -> RGB). إصلاح التنسيق من أجل الاتساق (تحويل صورة png الفردية إلى Jpeg). أسرع جيل القراءة مباشرة من الأرشيف.

    • 4.0.0 : (غير منشور)

    • 5.0.0 (افتراضي): واجهة برمجة تطبيقات مقسمة جديدة ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : تمت إضافة تقسيم الاختبار.

  • تعليمات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل البيانات المصدر يدويًا إلى download_config.manual_dir (الإعدادات الافتراضية هي ~/tensorflow_datasets/downloads/manual/ ):
    يجب أن يحتوي ملف manual_dir على ملفين: ILSVRC2012_img_train.tar وILSVRC2012_img_val.tar. تحتاج إلى التسجيل في https://image-net.org/download-images حتى تتمكن من الحصول على الرابط لتنزيل مجموعة البيانات.

  • التخزين المؤقت التلقائي ( الوثائق ): لا

  • هيكل الميزة :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
اسم الملف نص خيط
صورة صورة (لا شيء، لا شيء، 3) uint8
ملصق ClassLabel int64
  • المفاتيح الخاضعة للإشراف (راجع as_supervised doc ): ('image', 'label')

  • الاقتباس :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (التكوين الافتراضي)

  • وصف التكوين : 1% من إجمالي مجموعة تدريب ImageNet.

  • حجم التحميل : 254.22 KiB

  • حجم مجموعة البيانات : 7.61 GiB

  • الإنشقاقات :

ينقسم أمثلة
'train' 12,811
'validation' 50.000

التصور

imagenet2012_subset/10pct

  • وصف التكوين : 10% من إجمالي مجموعة تدريب ImageNet.

  • حجم التحميل : 2.48 MiB

  • حجم مجموعة البيانات : 19.91 GiB

  • الإنشقاقات :

ينقسم أمثلة
'train' 128,116
'validation' 50.000

التصور