Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023 Registre-se

Esta página foi traduzida pela API Cloud Translation.

mt_opt

Descrição :

Conjuntos de dados para o papel MT-Opt .

Página inicial : https://karolhausman.github.io/mt-opt/
Código -fonte: tfds.robotics.mt_opt.MtOpt
Versões :
- 1.0.0 (padrão): versão inicial.
Tamanho do download : Unknown size
Armazenado em cache automaticamente ( documentação ): Não
Chaves supervisionadas (Consulte as_supervised doc ): None
Figura ( tfds.show_examples ): Não suportado.
Citação :

@misc{kalashnikov2021mtopt,
      title={MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale},
      author={Dmitry Kalashnikov and Jacob Varley and Yevgen Chebotar and Benjamin Swanson and Rico Jonschkowski and Chelsea Finn and Sergey Levine and Karol Hausman},
      year={2021},
      eprint={2104.08212},
      archivePrefix={arXiv},
      primaryClass={cs.RO}
}

mt_opt/rlds (configuração padrão)

Descrição da configuração : este conjunto de dados contém episódios de tarefas coletados em uma frota de robôs reais. Segue o formato RLDS para representar etapas e episódios.
Tamanho do conjunto de dados : 4.38 TiB
Divisões :

Dividir	Exemplos
`'train'`	920.165

Estrutura de recursos :

FeaturesDict({
    'episode_id': string,
    'skill': uint8,
    'steps': Dataset({
        'action': FeaturesDict({
            'close_gripper': bool,
            'open_gripper': bool,
            'target_pose': Tensor(shape=(7,), dtype=float32),
            'terminate': bool,
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'gripper_closed': bool,
            'height_to_bottom': float32,
            'image': Image(shape=(512, 640, 3), dtype=uint8),
            'state_dense': Tensor(shape=(7,), dtype=float32),
        }),
    }),
    'task_code': string,
})

Documentação do recurso:

Característica	Classe	Forma	Tipo D
	RecursosDict
episódio_id	tensor		corda
habilidade	tensor		uint8
degraus	conjunto de dados
passos/ação	RecursosDict
passos/ação/close_gripper	tensor		bool
passos/ação/open_gripper	tensor		bool
passos/ação/target_pose	tensor	(7,)	float32
passos/ação/encerrar	tensor		bool
passos/é_primeiro	tensor		bool
passos/é_último	tensor		bool
passos/is_terminal	tensor		bool
passos/observação	RecursosDict
passos/observação/gripper_closed	tensor		bool
passos/observação/height_to_bottom	tensor		float32
passos/observação/imagem	Imagem	(512, 640, 3)	uint8
passos/observação/estado_denso	tensor	(7,)	float32
task_code	tensor		corda

Exemplos ( tfds.as_dataframe ):

mt_opt/sd

Descrição da configuração : o conjunto de dados de detectores de sucesso que contém definições de conclusão de tarefas com curadoria humana.
Tamanho do conjunto de dados : 548.56 GiB
Divisões :

Dividir	Exemplos
`'test'`	94.636
`'train'`	380.234

Estrutura de recursos :

FeaturesDict({
    'image_0': Image(shape=(512, 640, 3), dtype=uint8),
    'image_1': Image(shape=(480, 640, 3), dtype=uint8),
    'image_2': Image(shape=(480, 640, 3), dtype=uint8),
    'success': bool,
    'task_code': string,
})

Documentação do recurso:

Característica	Classe	Forma	Tipo D
	RecursosDict
imagem_0	Imagem	(512, 640, 3)	uint8
imagem_1	Imagem	(480, 640, 3)	uint8
imagem_2	Imagem	(480, 640, 3)	uint8
sucesso	tensor		bool
task_code	tensor		corda

Exemplos ( tfds.as_dataframe ):