rlu_rwrl

  • 説明:

RL Unplugged は、オフライン強化学習のベンチマーク スイートです。 RL Unplugged は、次の考慮事項に基づいて設計されています。使いやすさを促進するために、一般的なパイプラインが確立されると、実践者がスイート内のすべてのデータを簡単に操作できるようにする統合 API をデータセットに提供します。

データセットはRLDS 形式に従って、ステップとエピソードを表します。

データセットの例は、https://arxiv.org/abs/1904.12901 で説明されているように、部分的にオンラインでトレーニングされたエージェントを実行したときに保存された SAR 遷移を表しています。https ://github.com/google-researchで指定されているように、RLDS データセット形式に従います。 /rlds#データセット形式

合計 8 つのタスクで 40 のデータセットをリリースします。カートポール、ウォーカー、四足歩行、およびヒューマノイド タスクでは、組み合わせチャレンジなしと簡単な組み合わせチャレンジがあります。各タスクには、1%、5%、20%、40%、100% の 5 つの異なるサイズのデータ​​セットが含まれています。小さいデータセットが大きいデータセットのサブセットであるとは限らないことに注意してください。データセットの生成方法の詳細については、論文を参照してください。

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (デフォルト設定)

  • データセットサイズ: 172.43 KiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 5
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(1) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
歩数/観察/位置テンソル(3) float32
ステップ/観察/速度テンソル(2) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

  • データセットサイズ: 862.13 KiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 25
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(1) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
歩数/観察/位置テンソル(3) float32
ステップ/観察/速度テンソル(2) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

  • データセットのサイズ: 3.37 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 100
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(1) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
歩数/観察/位置テンソル(3) float32
ステップ/観察/速度テンソル(2) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

  • データセットのサイズ: 6.74 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 200
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(1) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
歩数/観察/位置テンソル(3) float32
ステップ/観察/速度テンソル(2) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

  • データセットサイズ: 16.84 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 500
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(1) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
歩数/観察/位置テンソル(3) float32
ステップ/観察/速度テンソル(2) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

  • データセットサイズ: 1.77 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 5
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(12) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/利己的な状態テンソル(44) float32
ステップ/観察/力_トルクテンソル(24) float32
歩数/観察/imuテンソル(6,) float32
steps/observation/torso_uprightテンソル(1) float32
steps/observation/torso_velocityテンソル(3) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent

  • データセットサイズ: 8.86 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 25
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(12) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/利己的な状態テンソル(44) float32
ステップ/観察/力_トルクテンソル(24) float32
歩数/観察/imuテンソル(6,) float32
steps/observation/torso_uprightテンソル(1) float32
steps/observation/torso_velocityテンソル(3) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent

  • データセットのサイズ: 35.46 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 100
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(12) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/利己的な状態テンソル(44) float32
ステップ/観察/力_トルクテンソル(24) float32
歩数/観察/imuテンソル(6,) float32
steps/observation/torso_uprightテンソル(1) float32
steps/observation/torso_velocityテンソル(3) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent

  • データセットのサイズ: 70.92 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 200
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(12) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/利己的な状態テンソル(44) float32
ステップ/観察/力_トルクテンソル(24) float32
歩数/観察/imuテンソル(6,) float32
steps/observation/torso_uprightテンソル(1) float32
steps/observation/torso_velocityテンソル(3) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

  • データセットのサイズ: 177.29 MiB

  • 自動キャッシュ(ドキュメント): shuffle_files=Falseの場合のみ (トレーニング)

  • スプリット:

スプリット
'train' 500
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(12) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/利己的な状態テンソル(44) float32
ステップ/観察/力_トルクテンソル(24) float32
歩数/観察/imuテンソル(6,) float32
steps/observation/torso_uprightテンソル(1) float32
steps/observation/torso_velocityテンソル(3) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

  • データセットサイズ: 6.27 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 50
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(6,) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
歩数/観察/高さテンソル(1) float32
手順/観察/向きテンソル(14) float32
ステップ/観察/速度テンソル(9) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

  • データセットのサイズ: 31.34 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 250
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(6,) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
歩数/観察/高さテンソル(1) float32
手順/観察/向きテンソル(14) float32
ステップ/観察/速度テンソル(9) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

  • データセットのサイズ: 125.37 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 1,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(6,) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
歩数/観察/高さテンソル(1) float32
手順/観察/向きテンソル(14) float32
ステップ/観察/速度テンソル(9) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

  • データセットのサイズ: 250.75 MiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 2,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(6,) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
歩数/観察/高さテンソル(1) float32
手順/観察/向きテンソル(14) float32
ステップ/観察/速度テンソル(9) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

  • データセットサイズ: 626.86 MiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 5,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(6,) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
歩数/観察/高さテンソル(1) float32
手順/観察/向きテンソル(14) float32
ステップ/観察/速度テンソル(9) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

  • データセットのサイズ: 69.40 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 200
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(21) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観測/com_velocityテンソル(3) float32
ステップ/観察/四肢テンソル(12) float32
ステップ/観察/head_heightテンソル(1) float32
ステップ/観察/ジョイント_角度テンソル(21) float32
steps/observation/torso_verticalテンソル(3) float32
ステップ/観察/速度テンソル(27) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

  • データセットサイズ: 346.98 MiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 1,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(21) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観測/com_velocityテンソル(3) float32
ステップ/観察/四肢テンソル(12) float32
ステップ/観察/head_heightテンソル(1) float32
ステップ/観察/ジョイント_角度テンソル(21) float32
steps/observation/torso_verticalテンソル(3) float32
ステップ/観察/速度テンソル(27) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

  • データセットサイズ: 1.36 GiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 4,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(21) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観測/com_velocityテンソル(3) float32
ステップ/観察/四肢テンソル(12) float32
ステップ/観察/head_heightテンソル(1) float32
ステップ/観察/ジョイント_角度テンソル(21) float32
steps/observation/torso_verticalテンソル(3) float32
ステップ/観察/速度テンソル(27) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

  • データセットサイズ: 2.71 GiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 8,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(21) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観測/com_velocityテンソル(3) float32
ステップ/観察/四肢テンソル(12) float32
ステップ/観察/head_heightテンソル(1) float32
ステップ/観察/ジョイント_角度テンソル(21) float32
steps/observation/torso_verticalテンソル(3) float32
ステップ/観察/速度テンソル(27) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

  • データセットサイズ: 6.78 GiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 20,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(21) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観測/com_velocityテンソル(3) float32
ステップ/観察/四肢テンソル(12) float32
ステップ/観察/head_heightテンソル(1) float32
ステップ/観察/ジョイント_角度テンソル(21) float32
steps/observation/torso_verticalテンソル(3) float32
ステップ/観察/速度テンソル(27) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

  • データセットサイズ: 369.84 KiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 5
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(1) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
歩数/観察/位置テンソル(3) float32
ステップ/観察/速度テンソル(2) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

  • データセットサイズ: 1.81 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 25
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(1) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
歩数/観察/位置テンソル(3) float32
ステップ/観察/速度テンソル(2) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

  • データセットサイズ: 7.22 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 100
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(1) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
歩数/観察/位置テンソル(3) float32
ステップ/観察/速度テンソル(2) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

  • データセットのサイズ: 14.45 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 200
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(1) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
歩数/観察/位置テンソル(3) float32
ステップ/観察/速度テンソル(2) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

  • データセットサイズ: 36.12 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 500
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(1) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
歩数/観察/位置テンソル(3) float32
ステップ/観察/速度テンソル(2) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent

  • データセットのサイズ: 1.97 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 5
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(12) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
ステップ/観察/利己的な状態テンソル(44) float32
ステップ/観察/力_トルクテンソル(24) float32
歩数/観察/imuテンソル(6,) float32
steps/observation/torso_uprightテンソル(1) float32
steps/observation/torso_velocityテンソル(3) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent

  • データセットサイズ: 9.83 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 25
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(12) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
ステップ/観察/利己的な状態テンソル(44) float32
ステップ/観察/力_トルクテンソル(24) float32
歩数/観察/imuテンソル(6,) float32
steps/observation/torso_uprightテンソル(1) float32
steps/observation/torso_velocityテンソル(3) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent

  • データセットサイズ: 39.31 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 100
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(12) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
ステップ/観察/利己的な状態テンソル(44) float32
ステップ/観察/力_トルクテンソル(24) float32
歩数/観察/imuテンソル(6,) float32
steps/observation/torso_uprightテンソル(1) float32
steps/observation/torso_velocityテンソル(3) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent

  • データセットのサイズ: 78.63 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 200
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(12) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
ステップ/観察/利己的な状態テンソル(44) float32
ステップ/観察/力_トルクテンソル(24) float32
歩数/観察/imuテンソル(6,) float32
steps/observation/torso_uprightテンソル(1) float32
steps/observation/torso_velocityテンソル(3) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent

  • データセットサイズ: 196.57 MiB

  • 自動キャッシュ(ドキュメント): shuffle_files=Falseの場合のみ (トレーニング)

  • スプリット:

スプリット
'train' 500
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(12) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
ステップ/観察/利己的な状態テンソル(44) float32
ステップ/観察/力_トルクテンソル(24) float32
歩数/観察/imuテンソル(6,) float32
steps/observation/torso_uprightテンソル(1) float32
steps/observation/torso_velocityテンソル(3) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

  • データセットサイズ: 8.20 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 50
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(6,) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
歩数/観察/高さテンソル(1) float32
手順/観察/向きテンソル(14) float32
ステップ/観察/速度テンソル(9) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

  • データセットのサイズ: 40.98 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 250
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(6,) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
歩数/観察/高さテンソル(1) float32
手順/観察/向きテンソル(14) float32
ステップ/観察/速度テンソル(9) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

  • データセットサイズ: 163.93 MiB

  • 自動キャッシュ(ドキュメント): shuffle_files=Falseの場合のみ (トレーニング)

  • スプリット:

スプリット
'train' 1,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(6,) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
歩数/観察/高さテンソル(1) float32
手順/観察/向きテンソル(14) float32
ステップ/観察/速度テンソル(9) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

  • データセットのサイズ: 327.86 MiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 2,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(6,) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
歩数/観察/高さテンソル(1) float32
手順/観察/向きテンソル(14) float32
ステップ/観察/速度テンソル(9) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

  • データセットサイズ: 819.65 MiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 5,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(6,) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
歩数/観察/高さテンソル(1) float32
手順/観察/向きテンソル(14) float32
ステップ/観察/速度テンソル(9) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

  • データセットのサイズ: 77.11 MiB

  • 自動キャッシュ(ドキュメント): はい

  • スプリット:

スプリット
'train' 200
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(21) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観測/com_velocityテンソル(3) float32
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
ステップ/観察/四肢テンソル(12) float32
ステップ/観察/head_heightテンソル(1) float32
ステップ/観察/ジョイント_角度テンソル(21) float32
steps/observation/torso_verticalテンソル(3) float32
ステップ/観察/速度テンソル(27) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

  • データセットサイズ: 385.54 MiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 1,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(21) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観測/com_velocityテンソル(3) float32
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
ステップ/観察/四肢テンソル(12) float32
ステップ/観察/head_heightテンソル(1) float32
ステップ/観察/ジョイント_角度テンソル(21) float32
steps/observation/torso_verticalテンソル(3) float32
ステップ/観察/速度テンソル(27) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

  • データセットサイズ: 1.51 GiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 4,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(21) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観測/com_velocityテンソル(3) float32
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
ステップ/観察/四肢テンソル(12) float32
ステップ/観察/head_heightテンソル(1) float32
ステップ/観察/ジョイント_角度テンソル(21) float32
steps/observation/torso_verticalテンソル(3) float32
ステップ/観察/速度テンソル(27) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

  • データセットサイズ: 3.01 GiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 8,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(21) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観測/com_velocityテンソル(3) float32
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
ステップ/観察/四肢テンソル(12) float32
ステップ/観察/head_heightテンソル(1) float32
ステップ/観察/ジョイント_角度テンソル(21) float32
steps/observation/torso_verticalテンソル(3) float32
ステップ/観察/速度テンソル(27) float32
ステップ/報酬テンソル(1) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

  • データセットサイズ: 7.53 GiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 20,000
  • 機能構造:
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_returnテンソルfloat32
ステップデータセット
ステップ/アクションテンソル(21) float32
ステップ/割引テンソル(1) float32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観測/com_velocityテンソル(3) float32
ステップ/観察/ダミー-0テンソル(1) float32
ステップ/観察/ダミー-1テンソル(1) float32
ステップ/観察/ダミー-2テンソル(1) float32
ステップ/観察/ダミー-3テンソル(1) float32
ステップ/観察/ダミー-4テンソル(1) float32
ステップ/観察/ダミー-5テンソル(1) float32
ステップ/観察/ダミー-6テンソル(1) float32
ステップ/観察/ダミー-7テンソル(1) float32
ステップ/観察/ダミー-8テンソル(1) float32
ステップ/観察/ダミー-9テンソル(1) float32
ステップ/観察/四肢テンソル(12) float32
ステップ/観察/head_heightテンソル(1) float32
ステップ/観察/ジョイント_角度テンソル(21) float32
steps/observation/torso_verticalテンソル(3) float32
ステップ/観察/速度テンソル(27) float32
ステップ/報酬テンソル(1) float32