กิตติ

คำอธิบาย :

Kitti ประกอบด้วยชุดงานด้านการมองเห็นที่สร้างขึ้นโดยใช้แพลตฟอร์มการขับขี่อัตโนมัติ การวัดประสิทธิภาพแบบเต็มประกอบด้วยงานต่างๆ มากมาย เช่น สเตอริโอ การไหลของแสง การวัดระยะทางด้วยภาพ ฯลฯ ชุดข้อมูลนี้ประกอบด้วยชุดข้อมูลการตรวจจับวัตถุ รวมถึงภาพตาข้างเดียวและกล่องขอบเขต ชุดข้อมูลประกอบด้วยรูปภาพการฝึกอบรม 7481 ภาพพร้อมคำอธิบายประกอบด้วยกล่องขอบเขต 3 มิติ คำอธิบายโดยละเอียดของคำอธิบายประกอบสามารถพบได้ใน readme ของ object development kit readme บนหน้าแรกของ Kitti

เอกสารเพิ่มเติม : สำรวจในเอกสารด้วยรหัส
หน้าแรก : http://www.cvlibs.net/datasets/kitti/
ซอร์สโค้ด : tfds.datasets.kitti.Builder
รุ่น :
- 3.1.0 : ไม่มีบันทึกประจำรุ่น
- 3.2.0 : อัปเดต Devkit แล้ว
- 3.3.0 (ค่าเริ่มต้น): เพิ่มป้ายกำกับสำหรับคุณลักษณะ occluded
ขนาดการดาวน์โหลด : 11.71 GiB
ขนาดชุดข้อมูล : 5.27 GiB
แคชอัตโนมัติ ( เอกสาร ): No
แยก :

แยก	ตัวอย่าง
`'test'`	711
`'train'`	6,347
`'validation'`	423

โครงสร้างคุณสมบัติ :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
        'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
        'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})

เอกสารคุณสมบัติ :

คุณสมบัติ	ระดับ	รูปร่าง	ประเภทD	คำอธิบาย
	คุณสมบัติDict
ภาพ	ภาพ	(ไม่มี ไม่มี 3)	uint8
รูปภาพ/file_name	ข้อความ		เชือก
วัตถุ	ลำดับ
วัตถุ/อัลฟ่า	เทนเซอร์		ลอย32	มุมสังเกตของวัตถุ มีตั้งแต่ [-pi..pi]
วัตถุ/bbox	คุณสมบัติ BBox	(4,)	ลอย32	กรอบขอบเขต 2 มิติของวัตถุในภาพ
วัตถุ/มิติ	เทนเซอร์	(3,)	ลอย32	ขนาดวัตถุ 3 มิติ: ความสูง ความกว้าง ความยาว (เป็นเมตร)
วัตถุ/สถานที่	เทนเซอร์	(3,)	ลอย32	ตำแหน่งของวัตถุ 3 มิติ x,y,z ในพิกัดของกล้อง (หน่วยเป็นเมตร)
วัตถุ/ถูกแยกออก	ClassLabel		int64	จำนวนเต็ม (0,1,2,3) บ่งชี้สถานะการบดเคี้ยว: 0 = มองเห็นได้ทั้งหมด, 1 = บดบังบางส่วน 2 = บดเคี้ยวส่วนใหญ่, 3 = ไม่ทราบ
วัตถุ/rotation_y	เทนเซอร์		ลอย32	การหมุนรอบแกน Y ในพิกัดกล้อง [-pi..pi]
วัตถุ/ถูกตัดทอน	เทนเซอร์		ลอย32	ลอยจาก 0 (ไม่ถูกตัดทอน) ถึง 1 (ถูกตัดทอน) โดยที่การตัดทอนหมายถึงวัตถุที่ออกจากขอบเขตรูปภาพ
วัตถุ/ประเภท	ClassLabel		int64	ประเภทของวัตถุ เช่น 'รถยนต์' หรือ 'รถตู้'

คีย์ภายใต้การดูแล (ดู as_supervised doc ): None
รูป ( tfds.show_examples ):

การแสดงภาพ

ตัวอย่าง ( tfds.as_dataframe ):

การอ้างอิง :

@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}

กิตติ จัดทุกอย่างให้เป็นระเบียบอยู่เสมอด้วยคอลเล็กชัน บันทึกและจัดหมวดหมู่เนื้อหาตามค่ากำหนดของคุณ

กิตติ