waymo_open_dataset

Waymo Open Dataset は、Waymo の自動運転車がさまざまな状況で収集した高解像度のセンサー データで構成されています。このデータは、非営利目的での使用が許可されています。

FeaturesDict({
    'camera_FRONT': FeaturesDict({
        'image': Image(shape=(1280, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_FRONT_LEFT': FeaturesDict({
        'image': Image(shape=(1280, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_FRONT_RIGHT': FeaturesDict({
        'image': Image(shape=(1280, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_SIDE_LEFT': FeaturesDict({
        'image': Image(shape=(886, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_SIDE_RIGHT': FeaturesDict({
        'image': Image(shape=(886, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'context': FeaturesDict({
        'name': Text(shape=(), dtype=string),
    }),
    'timestamp_micros': int64,
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
カメラ_フロント特徴辞書
camera_FRONT/画像画像(1280年、1920年、3) uint8
camera_FRONT/ラベル順序
camera_FRONT/labels/bbox BBoxFeature (4) float32
camera_FRONT/ラベル/タイプクラスラベルint64
camera_FRONT_LEFT特徴辞書
camera_FRONT_LEFT/画像画像(1280年、1920年、3) uint8
camera_FRONT_LEFT/ラベル順序
camera_FRONT_LEFT/labels/bbox BBoxFeature (4) float32
camera_FRONT_LEFT/ラベル/タイプクラスラベルint64
camera_FRONT_RIGHT特徴辞書
camera_FRONT_RIGHT/画像画像(1280年、1920年、3) uint8
camera_FRONT_RIGHT/ラベル順序
camera_FRONT_RIGHT/labels/bbox BBoxFeature (4) float32
camera_FRONT_RIGHT/ラベル/タイプクラスラベルint64
camera_SIDE_LEFT特徴辞書
camera_SIDE_LEFT/画像画像(886, 1920, 3) uint8
camera_SIDE_LEFT/ラベル順序
camera_SIDE_LEFT/labels/bbox BBoxFeature (4) float32
camera_SIDE_LEFT/ラベル/タイプクラスラベルint64
camera_SIDE_RIGHT特徴辞書
camera_SIDE_RIGHT/画像画像(886, 1920, 3) uint8
camera_SIDE_RIGHT/ラベル順序
camera_SIDE_RIGHT/labels/bbox BBoxFeature (4) float32
camera_SIDE_RIGHT/ラベル/タイプクラスラベルint64
環境特徴辞書
コンテキスト/名前文章ストリング
タイムスタンプ_マイクロテンソルint64
@InProceedings{Sun_2020_CVPR,
author = {Sun, Pei and Kretzschmar, Henrik and Dotiwalla, Xerxes and Chouard, Aurelien and Patnaik, Vijaysai and Tsui, Paul and Guo, James and Zhou, Yin and Chai, Yuning and Caine, Benjamin and Vasudevan, Vijay and Han, Wei and Ngiam, Jiquan and Zhao, Hang and Timofeev, Aleksei and Ettinger, Scott and Krivokon, Maxim and Gao, Amy and Joshi, Aditya and Zhang, Yu and Shlens, Jonathon and Chen, Zhifeng and Anguelov, Dragomir},
title = {Scalability in Perception for Autonomous Driving: Waymo Open Dataset},
booktitle = {The IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
month = {June},
year = {2020}
}

waymo_open_dataset/v1.2 (デフォルト設定)

  • 構成の説明: Waymo Open Dataset v1.2

  • データセットサイズ: 336.62 GiB

  • スプリット:

スプリット
'train' 158,081
'validation' 39,987

waymo_open_dataset/v1.1

  • 構成の説明: Waymo Open Dataset v1.1

  • データセットサイズ: 336.62 GiB

  • スプリット:

スプリット
'train' 158,081
'validation' 39,987

waymo_open_dataset/v1.0

  • 構成の説明: Waymo Open Dataset v1.0 このデータセットは前処理済みの形式でも利用できるため、正しい data_dir を選択すると読み込みが速くなります。
tfds.load('waymo_open_dataset/v1.0', data_dir='gs://waymo_open_dataset_v_1_0_0_individual_files/tensorflow_datasets')
  • データセットサイズ: 34.73 GiB

  • スプリット:

スプリット
'train' 14,884
'validation' 4,954