TFDS sekarang mendukung format Croissant 🥐 ! Baca dokumentasi untuk mengetahui lebih lanjut.

Halaman ini diterjemahkan oleh Cloud Translation API.

daya penggerak

Keterangan :

Kumpulan data dibuat dengan agen SAC yang dilatih tentang imbalan lingkungan dari tugas penggerak MuJoCo. Kumpulan data ini digunakan dalam Apa Pentingnya Pembelajaran Imitasi Adversarial? Orsini dkk. 2021 .

Kumpulan data mengikuti format RLDS untuk mewakili langkah dan episode

Beranda : https://github.com/google-research/rlds
Kode sumber : tfds.rlds.datasets.locomotion.Locomotion
Versi :
- 1.0.0 (default): Rilis awal.
Kunci yang diawasi (Lihat dokumen as_supervised ): None
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :

@article{orsini2021matters,
  title={What Matters for Adversarial Imitation Learning?},
  author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
  journal={International Conference in Machine Learning},
  year={2021}
}

penggerak/ant_sac_1M_single_policy_stochastic (konfigurasi default)

Deskripsi konfigurasi : Kumpulan data yang dihasilkan oleh agen SAC yang dilatih untuk 1 juta langkah untuk Ant.
Ukuran unduhan : 6.49 MiB
Ukuran kumpulan data : 23.02 MiB
Cache otomatis ( dokumentasi ): Ya
Perpecahan :

Membelah	Contoh
`'train'`	50

Struktur fitur :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Tipe D
	FiturDict
Langkah	Himpunan data
langkah/tindakan	Tensor	(8,)	float32
langkah/diskon	Tensor		float32
langkah/adalah_pertama	Tensor		bodoh
langkah/adalah_terakhir	Tensor		bodoh
langkah/is_terminal	Tensor		bodoh
langkah/pengamatan	Tensor	(111,)	float32
langkah/hadiah	Tensor		float32

Contoh ( tfds.as_dataframe ):

penggerak/hopper_sac_1M_single_policy_stochastic

Deskripsi konfigurasi : Kumpulan data yang dihasilkan oleh agen SAC yang dilatih untuk 1 juta langkah untuk Hopper.
Ukuran unduhan : 2.26 MiB
Ukuran kumpulan data : 2.62 MiB
Cache otomatis ( dokumentasi ): Ya
Perpecahan :

Membelah	Contoh
`'train'`	50

Struktur fitur :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(3,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(11,), dtype=float32),
        'reward': float32,
    }),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Tipe D
	FiturDict
Langkah	Himpunan data
langkah/tindakan	Tensor	(3,)	float32
langkah/diskon	Tensor		float32
langkah/adalah_pertama	Tensor		bodoh
langkah/adalah_terakhir	Tensor		bodoh
langkah/is_terminal	Tensor		bodoh
langkah/pengamatan	Tensor	(11,)	float32
langkah/hadiah	Tensor		float32

Contoh ( tfds.as_dataframe ):

penggerak/halfcheetah_sac_1M_single_policy_stochastic

Deskripsi konfigurasi : Kumpulan data yang dihasilkan oleh agen SAC yang dilatih untuk 1 juta langkah untuk HalfCheetah.
Ukuran unduhan : 4.49 MiB
Ukuran kumpulan data : 4.93 MiB
Cache otomatis ( dokumentasi ): Ya
Perpecahan :

Membelah	Contoh
`'train'`	50

Struktur fitur :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Tipe D
	FiturDict
Langkah	Himpunan data
langkah/tindakan	Tensor	(6,)	float32
langkah/diskon	Tensor		float32
langkah/adalah_pertama	Tensor		bodoh
langkah/adalah_terakhir	Tensor		bodoh
langkah/is_terminal	Tensor		bodoh
langkah/pengamatan	Tensor	(17,)	float32
langkah/hadiah	Tensor		float32

Contoh ( tfds.as_dataframe ):

penggerak/walker2d_sac_1M_single_policy_stochastic

Deskripsi konfigurasi : Kumpulan data yang dihasilkan oleh agen SAC yang dilatih untuk 1 juta langkah untuk Walker2d.
Ukuran unduhan : 4.35 MiB
Ukuran kumpulan data : 4.91 MiB
Cache otomatis ( dokumentasi ): Ya
Perpecahan :

Membelah	Contoh
`'train'`	50

Struktur fitur :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Tipe D
	FiturDict
Langkah	Himpunan data
langkah/tindakan	Tensor	(6,)	float32
langkah/diskon	Tensor		float32
langkah/adalah_pertama	Tensor		bodoh
langkah/adalah_terakhir	Tensor		bodoh
langkah/is_terminal	Tensor		bodoh
langkah/pengamatan	Tensor	(17,)	float32
langkah/hadiah	Tensor		float32

Contoh ( tfds.as_dataframe ):

penggerak/humanoid_sac_15M_single_policy_stochastic

Deskripsi konfigurasi : Kumpulan data yang dihasilkan oleh agen SAC yang dilatih untuk 15 juta langkah untuk Humanoid.
Ukuran unduhan : 192.78 MiB
Ukuran kumpulan data : 300.94 MiB
Cache otomatis ( dokumentasi ): Tidak
Perpecahan :

Membelah	Contoh
`'train'`	200

Struktur fitur :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(17,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(376,), dtype=float32),
        'reward': float32,
    }),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Tipe D
	FiturDict
Langkah	Himpunan data
langkah/tindakan	Tensor	(17,)	float32
langkah/diskon	Tensor		float32
langkah/adalah_pertama	Tensor		bodoh
langkah/adalah_terakhir	Tensor		bodoh
langkah/is_terminal	Tensor		bodoh
langkah/pengamatan	Tensor	(376,)	float32
langkah/hadiah	Tensor		float32

Contoh ( tfds.as_dataframe ):

daya penggerak Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.