rlu_atari_checkpoints_ordered

  • Описание :

RL Unplugged — это набор тестов для автономного обучения с подкреплением. RL Unplugged разработан с учетом следующих соображений: чтобы упростить использование, мы предоставляем наборы данных с унифицированным API, который позволяет практикующим специалистам легко работать со всеми данными в наборе после того, как общий конвейер был установлен.

Наборы данных соответствуют формату RLDS для представления шагов и эпизодов.

Мы выпускаем большой и разнообразный набор данных игрового процесса в соответствии с протоколом, описанным Agarwal et al., 2020 , который можно использовать для оценки нескольких дискретных автономных алгоритмов RL. Набор данных генерируется путем запуска онлайн-агента DQN и записи переходов из его воспроизведения во время обучения с помощью липких действий Machado et al., 2018 . Как указано в Agarwal et al., 2020 , для каждой игры мы используем данные пяти запусков с 50 миллионами переходов в каждом. Мы выпускаем наборы данных для 46 игр Atari. Подробнее о том, как был сгенерирован набор данных, см. в документе.

Atari — это стандартный тест RL. Мы рекомендуем вам попробовать офлайн-методы RL на Atari, если вы хотите сравнить свой подход с другими современными офлайн-методами RL с дискретными действиями.

Награда за каждый шаг усекается (получается с отсечением [-1, 1]), и эпизод включает в себя сумму усеченного вознаграждения за эпизод.

Каждая из конфигураций разбита на сплиты. Разделения соответствуют контрольным точкам в 1 млн шагов (обратите внимание, что количество эпизодов может отличаться). Контрольные точки упорядочены по времени (поэтому контрольная точка 0 выполнялась раньше контрольной точки 1).

Эпизоды внутри каждого сплита упорядочены. Проверьте https://www.tensorflow.org/datasets/determinism , если хотите убедиться, что вы читаете эпизоды по порядку.

Этот набор данных соответствует тому, который использовался в документе воспроизведения DQN. https://research.google/tools/datasets/dqn-replay/

Расколоть Примеры
  • Структура функции :
FeaturesDict({
    'checkpoint_id': tf.int64,
    'episode_id': tf.int64,
    'episode_return': Scalar(shape=(), dtype=tf.float32),
    'steps': Dataset({
        'action': tf.int64,
        'discount': tf.float32,
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': Image(shape=(84, 84, 1), dtype=tf.uint8),
        'reward': Scalar(shape=(), dtype=tf.float32),
    }),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание Диапазон значений
ОсобенностиDict
checkpoint_id Тензор tf.int64
id_эпизода Тензор tf.int64
эпизод_возврат Скаляр tf.float32 Сумма урезанных наград.
шаги Набор данных
шаги/действие Тензор tf.int64
шаги/скидка Тензор tf.float32
шаги / is_first Тензор tf.bool
шаги/is_last Тензор tf.bool
шаги/is_terminal Тензор tf.bool
шаги/наблюдение Изображение (84, 84, 1) tf.uint8
шаги/награда Скаляр tf.float32 Урезанная награда. [-1, 1]
@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_atari_checkpoints_ordered/Alien_run_1 (конфигурация по умолчанию)

rlu_atari_checkpoints_ordered/Alien_run_2

rlu_atari_checkpoints_ordered/Alien_run_3

rlu_atari_checkpoints_ordered/Alien_run_4

rlu_atari_checkpoints_ordered/Alien_run_5

rlu_atari_checkpoints_ordered/Amidar_run_1

rlu_atari_checkpoints_ordered/Amidar_run_2

rlu_atari_checkpoints_ordered/Amidar_run_3

rlu_atari_checkpoints_ordered/Amidar_run_4

rlu_atari_checkpoints_ordered/Amidar_run_5

rlu_atari_checkpoints_ordered/Assault_run_1

rlu_atari_checkpoints_ordered/Assault_run_2

rlu_atari_checkpoints_ordered/Assault_run_3

rlu_atari_checkpoints_ordered/Assault_run_4

rlu_atari_checkpoints_ordered/Assault_run_5

rlu_atari_checkpoints_ordered/Asterix_run_1

rlu_atari_checkpoints_ordered/Asterix_run_2

rlu_atari_checkpoints_ordered/Asterix_run_3

rlu_atari_checkpoints_ordered/Asterix_run_4

rlu_atari_checkpoints_ordered/Asterix_run_5

rlu_atari_checkpoints_ordered/Atlantis_run_1

rlu_atari_checkpoints_ordered/Atlantis_run_2

rlu_atari_checkpoints_ordered/Atlantis_run_3

rlu_atari_checkpoints_ordered/Atlantis_run_4

rlu_atari_checkpoints_ordered/Atlantis_run_5

rlu_atari_checkpoints_ordered/BankHeist_run_1

rlu_atari_checkpoints_ordered/BankHeist_run_2

rlu_atari_checkpoints_ordered/BankHeist_run_3

rlu_atari_checkpoints_ordered/BankHeist_run_4

rlu_atari_checkpoints_ordered/BankHeist_run_5

rlu_atari_checkpoints_ordered/BattleZone_run_1

rlu_atari_checkpoints_ordered/BattleZone_run_2

rlu_atari_checkpoints_ordered/BattleZone_run_3

rlu_atari_checkpoints_ordered/BattleZone_run_4

rlu_atari_checkpoints_ordered/BattleZone_run_5

rlu_atari_checkpoints_ordered/BeamRider_run_1

rlu_atari_checkpoints_ordered/BeamRider_run_2

rlu_atari_checkpoints_ordered/BeamRider_run_3

rlu_atari_checkpoints_ordered/BeamRider_run_4

rlu_atari_checkpoints_ordered/BeamRider_run_5

rlu_atari_checkpoints_ordered/Boxing_run_1

rlu_atari_checkpoints_ordered/Boxing_run_2

rlu_atari_checkpoints_ordered/Boxing_run_3

rlu_atari_checkpoints_ordered/Boxing_run_4

rlu_atari_checkpoints_ordered/Boxing_run_5

rlu_atari_checkpoints_ordered/Breakout_run_1

rlu_atari_checkpoints_ordered/Breakout_run_2

rlu_atari_checkpoints_ordered/Breakout_run_3

rlu_atari_checkpoints_ordered/Breakout_run_4

rlu_atari_checkpoints_ordered/Breakout_run_5

rlu_atari_checkpoints_ordered/Carnival_run_1

rlu_atari_checkpoints_ordered/Carnival_run_2

rlu_atari_checkpoints_ordered/Carnival_run_3

rlu_atari_checkpoints_ordered/Carnival_run_4

rlu_atari_checkpoints_ordered/Carnival_run_5

rlu_atari_checkpoints_ordered/Сороконожка_run_1

rlu_atari_checkpoints_ordered/Сороконожка_run_2

rlu_atari_checkpoints_ordered/Сороконожка_run_3

rlu_atari_checkpoints_ordered/Сороконожка_run_4

rlu_atari_checkpoints_ordered/Сороконожка_run_5

rlu_atari_checkpoints_ordered/ChopperCommand_run_1

rlu_atari_checkpoints_ordered/ChopperCommand_run_2

rlu_atari_checkpoints_ordered/ChopperCommand_run_3

rlu_atari_checkpoints_ordered/ChopperCommand_run_4

rlu_atari_checkpoints_ordered/ChopperCommand_run_5

rlu_atari_checkpoints_ordered/CrazyClimber_run_1

rlu_atari_checkpoints_ordered/CrazyClimber_run_2

rlu_atari_checkpoints_ordered/CrazyClimber_run_3

rlu_atari_checkpoints_ordered/CrazyClimber_run_4

rlu_atari_checkpoints_ordered/CrazyClimber_run_5

rlu_atari_checkpoints_ordered/DemonAttack_run_1

rlu_atari_checkpoints_ordered/DemonAttack_run_2

rlu_atari_checkpoints_ordered/DemonAttack_run_3

rlu_atari_checkpoints_ordered/DemonAttack_run_4

rlu_atari_checkpoints_ordered/DemonAttack_run_5

rlu_atari_checkpoints_ordered/DoubleDunk_run_1

rlu_atari_checkpoints_ordered/DoubleDunk_run_2

rlu_atari_checkpoints_ordered/DoubleDunk_run_3

rlu_atari_checkpoints_ordered/DoubleDunk_run_4

rlu_atari_checkpoints_ordered/DoubleDunk_run_5

rlu_atari_checkpoints_ordered/Enduro_run_1

rlu_atari_checkpoints_ordered/Enduro_run_2

rlu_atari_checkpoints_ordered/Enduro_run_3

rlu_atari_checkpoints_ordered/Enduro_run_4

rlu_atari_checkpoints_ordered/Enduro_run_5

rlu_atari_checkpoints_ordered/FishingDerby_run_1

rlu_atari_checkpoints_ordered/FishingDerby_run_2

rlu_atari_checkpoints_ordered/FishingDerby_run_3

rlu_atari_checkpoints_ordered/FishingDerby_run_4

rlu_atari_checkpoints_ordered/FishingDerby_run_5

rlu_atari_checkpoints_ordered/Freeway_run_1

rlu_atari_checkpoints_ordered/Freeway_run_2

rlu_atari_checkpoints_ordered/Freeway_run_3

rlu_atari_checkpoints_ordered/Freeway_run_4

rlu_atari_checkpoints_ordered/Freeway_run_5

rlu_atari_checkpoints_ordered/Frostbite_run_1

rlu_atari_checkpoints_ordered/Frostbite_run_2

rlu_atari_checkpoints_ordered/Frostbite_run_3

rlu_atari_checkpoints_ordered/Frostbite_run_4

rlu_atari_checkpoints_ordered/Frostbite_run_5

rlu_atari_checkpoints_ordered/Суслик_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Суслик_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Суслик_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Суслик_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Суслик_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Gravitar_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Gravitar_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Gravitar_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Gravitar_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Gravitar_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Hero_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Hero_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Hero_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Hero_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Hero_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/IceHockey_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/IceHockey_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/IceHockey_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/IceHockey_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/IceHockey_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Jamesbond_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Jamesbond_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Jamesbond_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Jamesbond_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Jamesbond_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/кенгуру_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/кенгуру_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/кенгуру_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/кенгуру_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/кенгуру_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Krull_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Krull_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Krull_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Krull_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Krull_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/KungFuMaster_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/KungFuMaster_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/KungFuMaster_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/KungFuMaster_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/KungFuMaster_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/MsPacman_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/MsPacman_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/MsPacman_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/MsPacman_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/MsPacman_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/NameThisGame_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/NameThisGame_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/NameThisGame_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/NameThisGame_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/NameThisGame_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Phoenix_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Phoenix_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Phoenix_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Phoenix_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Phoenix_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Pong_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Pong_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Pong_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Pong_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Pong_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Pooyan_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Pooyan_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Pooyan_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Pooyan_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Pooyan_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Qbert_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Qbert_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Qbert_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Qbert_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Qbert_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Riverraid_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Riverraid_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Riverraid_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Riverraid_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Riverraid_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/RoadRunner_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/RoadRunner_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/RoadRunner_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/RoadRunner_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/RoadRunner_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Robotank_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Robotank_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Robotank_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Robotank_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Robotank_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Seaquest_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Seaquest_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Seaquest_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Seaquest_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Seaquest_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/SpaceInvaders_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/SpaceInvaders_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/SpaceInvaders_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/SpaceInvaders_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/SpaceInvaders_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/StarGunner_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/StarGunner_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/StarGunner_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/StarGunner_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/StarGunner_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/TimePilot_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/TimePilot_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/TimePilot_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/TimePilot_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/TimePilot_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/UpNdown_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/UpNdown_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/UpNdown_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/UpNDown_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/UpNdown_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/VideoPinball_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/VideoPinball_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/VideoPinball_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/VideoPinball_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/VideoPinball_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/WizardOfWor_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/WizardOfWor_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/WizardOfWor_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/WizardOfWor_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/WizardOfWor_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/YarsRevenge_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/YarsRevenge_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/YarsRevenge_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/YarsRevenge_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/YarsRevenge_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Zaxxon_run_1

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Zaxxon_run_2

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Zaxxon_run_3

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Zaxxon_run_4

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.

rlu_atari_checkpoints_ordered/Zaxxon_run_5

  • Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.