stanford_dogs

  • คำอธิบาย :

ชุดข้อมูล Stanford Dogs มีภาพของสุนัข 120 สายพันธุ์จากทั่วโลก ชุดข้อมูลนี้สร้างขึ้นโดยใช้รูปภาพและคำอธิบายประกอบจาก ImageNet สำหรับงานจัดหมวดหมู่รูปภาพแบบละเอียด มีภาพทั้งหมด 20,580 ภาพ โดย 12,000 ภาพใช้สำหรับการฝึกอบรม และ 8580 ภาพสำหรับการทดสอบ มีป้ายกำกับคลาสและคำอธิบายประกอบสำหรับรูปภาพทั้งหมด 12,000 ภาพ

แยก ตัวอย่าง
'test' 8,580
'train' 12,000
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=120),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
    }),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (ไม่มี, ไม่มี, 3) uint8
รูปภาพ/ชื่อไฟล์ ข้อความ สตริง
ฉลาก ป้ายกำกับคลาส int64
วัตถุ ลำดับ
วัตถุ/bbox คุณสมบัติ BBox (4,) ลอย32

การสร้างภาพ

  • การอ้างอิง :
@inproceedings{KhoslaYaoJayadevaprakashFeiFei_FGVC2011,
author = "Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and
          Li Fei-Fei",
title = "Novel Dataset for Fine-Grained Image Categorization",
booktitle = "First Workshop on Fine-Grained Visual Categorization,
             IEEE Conference on Computer Vision and Pattern Recognition",
year = "2011",
month = "June",
address = "Colorado Springs, CO",
}
@inproceedings{imagenet_cvpr09,
        AUTHOR = {Deng, J. and Dong, W. and Socher, R. and Li, L.-J. and
                  Li, K. and Fei-Fei, L.},
        TITLE = { {ImageNet: A Large-Scale Hierarchical Image Database} },
        BOOKTITLE = {CVPR09},
        YEAR = {2009},
        BIBSOURCE = "http://www.image-net.org/papers/imagenet_cvpr09.bib"}