open_images_v4

  • คำอธิบาย :

Open Images คือชุดข้อมูลของรูปภาพประมาณ 9 ล้านภาพที่ได้รับการใส่คำอธิบายประกอบด้วยป้ายกำกับระดับรูปภาพและกล่องขอบเขตวัตถุ

ชุดการฝึกของ V4 ประกอบด้วย Bounding Box 14.6M สำหรับคลาสอ็อบเจ็กต์ 600 คลาสบนอิมเมจ 1.74M ทำให้เป็นชุดข้อมูลที่ใหญ่ที่สุดที่มีอยู่พร้อมคำอธิบายประกอบตำแหน่งของอ็อบเจ็กต์ กล่องต่างๆ ได้รับการวาดด้วยมือส่วนใหญ่โดยนักอธิบายประกอบมืออาชีพเพื่อให้มั่นใจในความถูกต้องและสม่ำเสมอ รูปภาพมีความหลากหลายมากและมักจะมีฉากที่ซับซ้อนซึ่งมีวัตถุหลายอย่าง (โดยเฉลี่ย 8.4 ต่อภาพ) นอกจากนี้ ชุดข้อมูลยังได้รับการใส่คำอธิบายประกอบด้วยป้ายกำกับระดับรูปภาพซึ่งครอบคลุมคลาสหลายพันคลาส

แยก ตัวอย่าง
'test' 125,436
'train' 1,743,042
'validation' 41,620
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
   
'bobjects': Sequence({
       
'bbox': BBoxFeature(shape=(4,), dtype=float32),
       
'is_depiction': int8,
       
'is_group_of': int8,
       
'is_inside': int8,
       
'is_occluded': int8,
       
'is_truncated': int8,
       
'label': ClassLabel(shape=(), dtype=int64, num_classes=601),
       
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
   
'image': Image(shape=(None, None, 3), dtype=uint8),
   
'image/filename': Text(shape=(), dtype=string),
   
'objects': Sequence({
       
'confidence': int32,
       
'label': ClassLabel(shape=(), dtype=int64, num_classes=19995),
       
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
   
'objects_trainable': Sequence({
       
'confidence': int32,
       
'label': ClassLabel(shape=(), dtype=int64, num_classes=7186),
       
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
วัตถุ ลำดับ
bobjects/bbox คุณสมบัติ BBox (4,) ลอย32
bobjects/is_depiction เทนเซอร์ int8
bobjects/is_group_of เทนเซอร์ int8
bobjects/is_inside เทนเซอร์ int8
bobjects/is_occluded เทนเซอร์ int8
bobjects/is_truncated เทนเซอร์ int8
วัตถุ/ฉลาก ClassLabel int64
bobjects/แหล่งที่มา ClassLabel int64
ภาพ ภาพ (ไม่มี ไม่มี 3) uint8
รูปภาพ/ชื่อไฟล์ ข้อความ เชือก
วัตถุ ลำดับ
วัตถุ/ความมั่นใจ เทนเซอร์ int32
วัตถุ/ฉลาก ClassLabel int64
วัตถุ/แหล่งที่มา ClassLabel int64
object_trainable ลำดับ
object_trainable/ความมั่นใจ เทนเซอร์ int32
object_trainable/ฉลาก ClassLabel int64
object_trainable/แหล่งที่มา ClassLabel int64
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

  • การอ้างอิง :

@article{OpenImages,
  author
= {Alina Kuznetsova and
           
Hassan Rom and
           
Neil Alldrin and
           
Jasper Uijlings and
           
Ivan Krasin and
           
Jordi Pont-Tuset and
           
Shahab Kamali and
           
Stefan Popov and
           
Matteo Malloci and
           
Tom Duerig and
           
Vittorio Ferrari},
  title
= {The Open Images Dataset V4: Unified image classification,
           
object detection, and visual relationship detection at scale},
  year
= {2018},
  journal
= {arXiv:1811.00982}
}
@article{OpenImages2,
  author
= {Krasin, Ivan and
           
Duerig, Tom and
           
Alldrin, Neil and
           
Ferrari, Vittorio
           
and Abu-El-Haija, Sami and
           
Kuznetsova, Alina and
           
Rom, Hassan and
           
Uijlings, Jasper and
           
Popov, Stefan and
           
Kamali, Shahab and
           
Malloci, Matteo and
           
Pont-Tuset, Jordi and
           
Veit, Andreas and
           
Belongie, Serge and
           
Gomes, Victor and
           
Gupta, Abhinav and
           
Sun, Chen and
           
Chechik, Gal and
           
Cai, David and
           
Feng, Zheyun and
           
Narayanan, Dhyanesh and
           
Murphy, Kevin},
  title
= {OpenImages: A public dataset for large-scale multi-label and
           multi
-class image classification.},
  journal
= {Dataset available from
             https
://storage.googleapis.com/openimages/web/index.html},
  year
={2017}
}

open_images_v4/ต้นฉบับ (การกำหนดค่าเริ่มต้น)

  • คำอธิบายการกำหนดค่า : ภาพที่ความละเอียดและคุณภาพดั้งเดิม

  • ขนาดชุดข้อมูล : 562.42 GiB

  • รูป ( tfds.show_examples ):

การแสดงภาพ

open_images_v4/300k

  • คำอธิบายการกำหนดค่า : รูปภาพมีขนาดประมาณ 300,000 พิกเซล ที่คุณภาพ 72 JPEG

  • ขนาดชุดข้อมูล : 81.92 GiB

  • รูป ( tfds.show_examples ):

การแสดงภาพ

open_images_v4/200k

  • คำอธิบายการกำหนดค่า : รูปภาพมีขนาดประมาณ 200,000 พิกเซล ที่คุณภาพ 72 JPEG

  • ขนาดชุดข้อมูล : 60.70 GiB

  • รูป ( tfds.show_examples ):

การแสดงภาพ