استانفورد_سگ

  • توضیحات :

مجموعه داده Stanford Dogs شامل تصاویری از 120 نژاد سگ از سراسر جهان است. این مجموعه داده با استفاده از تصاویر و حاشیه نویسی از ImageNet برای طبقه بندی تصاویر ریز دانه ساخته شده است. 20580 تصویر وجود دارد که از این تعداد 12000 برای آموزش و 8580 تصویر برای تست استفاده می شود. برچسب‌های کلاس و حاشیه‌نویسی جعبه محدود برای همه 12000 تصویر ارائه شده است.

شکاف مثال ها
'test' 8580
'train' 12000
  • ساختار ویژگی :
FeaturesDict({
   
'image': Image(shape=(None, None, 3), dtype=uint8),
   
'image/filename': Text(shape=(), dtype=string),
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=120),
   
'objects': Sequence({
       
'bbox': BBoxFeature(shape=(4,), dtype=float32),
   
}),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
تصویر تصویر (هیچ، هیچ، 3) uint8
تصویر/نام فایل متن رشته
برچسب ClassLabel int64
اشیاء توالی
اشیاء/bbox ویژگی BBox (4،) float32

تجسم

  • نقل قول :
@inproceedings{KhoslaYaoJayadevaprakashFeiFei_FGVC2011,
author
= "Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and
          Li Fei-Fei"
,
title
= "Novel Dataset for Fine-Grained Image Categorization",
booktitle
= "First Workshop on Fine-Grained Visual Categorization,
             IEEE Conference on Computer Vision and Pattern Recognition"
,
year
= "2011",
month
= "June",
address
= "Colorado Springs, CO",
}
@inproceedings{imagenet_cvpr09,
        AUTHOR
= {Deng, J. and Dong, W. and Socher, R. and Li, L.-J. and
                 
Li, K. and Fei-Fei, L.},
        TITLE
= { {ImageNet: A Large-Scale Hierarchical Image Database} },
        BOOKTITLE
= {CVPR09},
        YEAR
= {2009},
        BIBSOURCE
= "http://www.image-net.org/papers/imagenet_cvpr09.bib"}