waymo_open_dataset

  • 説明

Waymo オープン データセットは、さまざまな状況で Waymo 自動運転車によって収集された高解像度センサー データで構成されています。このデータは非営利使用が許可されています。

FeaturesDict({
    'camera_FRONT': FeaturesDict({
        'image': Image(shape=(1280, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_FRONT_LEFT': FeaturesDict({
        'image': Image(shape=(1280, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_FRONT_RIGHT': FeaturesDict({
        'image': Image(shape=(1280, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_SIDE_LEFT': FeaturesDict({
        'image': Image(shape=(886, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_SIDE_RIGHT': FeaturesDict({
        'image': Image(shape=(886, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'context': FeaturesDict({
        'name': Text(shape=(), dtype=string),
    }),
    'timestamp_micros': int64,
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
カメラ_フロント特徴辞書
カメラ_FRONT/画像画像(1280、1920、3) uint8
カメラ_FRONT/ラベル順序
カメラ_FRONT/ラベル/bbox BBox機能(4,) float32
カメラ_FRONT/ラベル/タイプクラスラベルint64
カメラ_FRONT_LEFT特徴辞書
カメラ_FRONT_LEFT/画像画像(1280、1920、3) uint8
カメラ_FRONT_LEFT/ラベル順序
カメラ_FRONT_LEFT/ラベル/bbox BBox機能(4,) float32
カメラ_FRONT_LEFT/ラベル/タイプクラスラベルint64
カメラ_FRONT_RIGHT特徴辞書
カメラ_FRONT_RIGHT/画像画像(1280、1920、3) uint8
カメラ_FRONT_RIGHT/ラベル順序
カメラ_FRONT_RIGHT/ラベル/bbox BBox機能(4,) float32
カメラ_FRONT_RIGHT/ラベル/タイプクラスラベルint64
カメラ_SIDE_LEFT特徴辞書
カメラ_SIDE_LEFT/画像画像(886、1920、3) uint8
カメラ_SIDE_LEFT/ラベル順序
カメラ_SIDE_LEFT/ラベル/bbox BBox機能(4,) float32
カメラ_SIDE_LEFT/ラベル/タイプクラスラベルint64
カメラ_SIDE_RIGHT特徴辞書
カメラ_SIDE_RIGHT/画像画像(886、1920、3) uint8
カメラ_SIDE_RIGHT/ラベル順序
カメラ_SIDE_RIGHT/ラベル/bbox BBox機能(4,) float32
カメラ_SIDE_RIGHT/ラベル/タイプクラスラベルint64
コンテクスト特徴辞書
コンテキスト/名前文章
タイムスタンプ_microsテンソルint64
@InProceedings{Sun_2020_CVPR,
author = {Sun, Pei and Kretzschmar, Henrik and Dotiwalla, Xerxes and Chouard, Aurelien and Patnaik, Vijaysai and Tsui, Paul and Guo, James and Zhou, Yin and Chai, Yuning and Caine, Benjamin and Vasudevan, Vijay and Han, Wei and Ngiam, Jiquan and Zhao, Hang and Timofeev, Aleksei and Ettinger, Scott and Krivokon, Maxim and Gao, Amy and Joshi, Aditya and Zhang, Yu and Shlens, Jonathon and Chen, Zhifeng and Anguelov, Dragomir},
title = {Scalability in Perception for Autonomous Driving: Waymo Open Dataset},
booktitle = {The IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
month = {June},
year = {2020}
}

waymo_open_dataset/v1.2 (デフォルト設定)

  • 構成の説明: Waymo オープン データセット v1.2

  • データセットのサイズ: 336.62 GiB

  • 分割:

スプリット
'train' 158,081
'validation' 39,987

waymo_open_dataset/v1.1

  • 構成の説明: Waymo オープン データセット v1.1

  • データセットのサイズ: 336.62 GiB

  • 分割:

スプリット
'train' 158,081
'validation' 39,987

waymo_open_dataset/v1.0

  • 構成の説明: Waymo Open Dataset v1.0 このデータセットは前処理された形式でも利用できるため、正しい data_dir を選択すると読み込みが速くなります。
tfds.load('waymo_open_dataset/v1.0', data_dir='gs://waymo_open_dataset_v_1_0_0_individual_files/tensorflow_datasets')
  • データセットのサイズ: 34.73 GiB

  • 分割:

スプリット
'train' 14,884
'validation' 4,954