imagenet2012_subset

  • คำอธิบาย :

Imagenet2012Subset เป็นชุดย่อยของชุดข้อมูล ImageNet ILSVRC 2012 ดั้งเดิม ชุดข้อมูลใช้ชุดการตรวจสอบ เดียวกัน กับชุดข้อมูล ImageNet ILSVRC 2012 ดั้งเดิม อย่างไรก็ตาม ชุดการฝึกจะถูกสุ่มตัวอย่างโดยมีป้ายกำกับที่สมดุล ในการกำหนดค่า 1pct 1% หรือ 12811 รูปภาพจะถูกสุ่มตัวอย่าง คลาสส่วนใหญ่มีจำนวนรูปภาพเท่ากัน (เฉลี่ย 12.8) บางคลาสจะสุ่มมี 1 ตัวอย่างมากกว่าคลาสอื่น และในการกำหนดค่า 10pct % ~ 10% หรือ 128116 คลาสส่วนใหญ่มีจำนวนรูปภาพเท่ากัน (เฉลี่ย 128) และบางคลาสจะสุ่มมี 1 ตัวอย่างมากกว่าคลาสอื่น

สิ่งนี้ควรจะใช้เป็นเกณฑ์มาตรฐานสำหรับการเรียนรู้แบบกึ่งกำกับดูแล และเดิมทีใช้ในเอกสาร SimCLR ( https://arxiv.org/abs/2002.05709 )

  • หน้าแรก : http://image-net.org/

  • ซอร์สโค้ด : tfds.datasets.imagenet2012_subset.Builder

  • รุ่น :

    • 2.0.0 : แก้ไขป้ายกำกับการตรวจสอบความถูกต้อง
    • 2.0.1 : แก้ไขการเข้ารหัส ไม่มีการเปลี่ยนแปลงจากมุมมองของผู้ใช้
    • 3.0.0 : แก้ไขการปรับสีของภาพ ~12 ภาพ (CMYK -> RGB) แก้ไขรูปแบบเพื่อความสอดคล้อง (แปลงรูปภาพ PNG เดียวเป็น Jpeg) รุ่นที่เร็วกว่าอ่านโดยตรงจากไฟล์เก็บถาวร

    • 4.0.0 : (ไม่ได้เผยแพร่)

    • 5.0.0 (ค่าเริ่มต้น): API แยกใหม่ ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : เพิ่มการแยกการทดสอบ

  • คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้ต้องการให้คุณดาวน์โหลดข้อมูลต้นฉบับด้วยตนเองลงใน download_config.manual_dir (ค่าเริ่มต้นเป็น ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir ควรมีสองไฟล์: ILSVRC2012_img_train.tar และ ILSVRC2012_img_val.tar คุณต้องลงทะเบียนใน https://image-net.org/download-images เพื่อรับลิงก์สำหรับดาวน์โหลดชุดข้อมูล

  • แคชอัตโนมัติ ( เอกสาร ): No

  • โครงสร้างคุณสมบัติ :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ชื่อไฟล์ ข้อความ เชือก
ภาพ ภาพ (ไม่มี ไม่มี 3) uint8
ฉลาก ClassLabel int64
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('image', 'label')

  • การอ้างอิง :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (การกำหนดค่าเริ่มต้น)

  • คำอธิบายการกำหนดค่า : 1 ชิ้นของชุดการฝึกอบรม ImageNet ทั้งหมด

  • ขนาดดาวน์โหลด : 254.22 KiB

  • ขนาดชุดข้อมูล : 7.61 GiB

  • แยก :

แยก ตัวอย่าง
'train' 12,811
'validation' 50,000

การแสดงภาพ

imagenet2012_subset/10pct

  • คำอธิบายการกำหนดค่า : 10% ของชุดการฝึกอบรม ImageNet ทั้งหมด

  • ขนาดดาวน์โหลด : 2.48 MiB

  • ขนาดชุดข้อมูล : 19.91 GiB

  • แยก :

แยก ตัวอย่าง
'train' 128,116
'validation' 50,000

การแสดงภาพ