キティ

説明：

Kitti には、自動運転プラットフォームを使用して構築された一連のビジョンタスクが含まれています。完全なベンチマークには、ステレオ、オプティカルフロー、ビジュアルオドメトリなどの多くのタスクが含まれています。このデータセットには、単眼画像や境界ボックスを含む物体検出データセットが含まれています。データセットには、3D 境界ボックスで注釈が付けられた 7481 個のトレーニング画像が含まれています。注釈の完全な説明は、Kitti ホームページにあるオブジェクト開発キットの Readme に記載されています。

追加ドキュメント:コード付きの論文について調べる
ホームページ: http://www.cvlibs.net/datasets/kitti/
ソースコード: tfds.datasets.kitti.Builder
バージョン:
- 3.1.0 : リリースノートはありません。
- 3.2.0 : 開発キットが更新されました。
- 3.3.0 (デフォルト): occludedフィーチャのラベルを追加しました。
ダウンロードサイズ: 11.71 GiB
データセットのサイズ: 5.27 GiB
自動キャッシュ(ドキュメント): いいえ
分割:

スプリット	例
`'test'`	711
`'train'`	6,347
`'validation'`	423

機能の構造:

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
        'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
        'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})

機能ドキュメント:

特徴	クラス	形	Dタイプ	説明
	特徴辞書
画像	画像	(なし、なし、3)	uint8
画像/ファイル名	文章		弦
オブジェクト	順序
オブジェクト/アルファ	テンソル		float32	オブジェクトの観察角度、範囲 [-pi..pi]
オブジェクト/Bボックス	BBox機能	(4,)	float32	画像内のオブジェクトの 2D 境界ボックス
オブジェクト/寸法	テンソル	(3,)	float32	3D オブジェクトの寸法: 高さ、幅、長さ (メートル単位)
オブジェクト/場所	テンソル	(3,)	float32	カメラ座標における 3D オブジェクトの位置 x、y、z (メートル単位)
オブジェクト/遮蔽物	クラスラベル		int64	オクルージョン状態を示す整数 (0、1、2、3): 0 = 完全に表示、1 = 部分的にオクルージョン2 = 大幅にオクルージョン、3 = 不明
オブジェクト/回転_y	テンソル		float32	カメラ座標における Y 軸周りの回転 ry [-pi..pi]
オブジェクト/切り捨てられた	テンソル		float32	0 (切り捨てられていない) から 1 (切り捨てられた) までの浮動小数点。切り捨てられたとは、画像の境界を残すオブジェクトを指します。
オブジェクト/タイプ	クラスラベル		int64	オブジェクトのタイプ (例: 「車」または「バン」)

監視キー( as_supervised docを参照): None
図( tfds.show_examples ):

視覚化

例( tfds.as_dataframe ):

引用：

@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}