mt_opt

  • Descrição :

Conjuntos de dados para o papel MT-Opt .

@misc{kalashnikov2021mtopt,
      title
={MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale},
      author
={Dmitry Kalashnikov and Jacob Varley and Yevgen Chebotar and Benjamin Swanson and Rico Jonschkowski and Chelsea Finn and Sergey Levine and Karol Hausman},
      year
={2021},
      eprint
={2104.08212},
      archivePrefix
={arXiv},
      primaryClass
={cs.RO}
}

mt_opt/rlds (configuração padrão)

  • Descrição da configuração : este conjunto de dados contém episódios de tarefas coletados em uma frota de robôs reais. Segue o formato RLDS para representar etapas e episódios.

  • Tamanho do conjunto de dados : 4.38 TiB

  • Divisões :

Dividir Exemplos
'train' 920.165
  • Estrutura de recursos :
FeaturesDict({
   
'episode_id': string,
   
'skill': uint8,
   
'steps': Dataset({
       
'action': FeaturesDict({
           
'close_gripper': bool,
           
'open_gripper': bool,
           
'target_pose': Tensor(shape=(7,), dtype=float32),
           
'terminate': bool,
       
}),
       
'is_first': bool,
       
'is_last': bool,
       
'is_terminal': bool,
       
'observation': FeaturesDict({
           
'gripper_closed': bool,
           
'height_to_bottom': float32,
           
'image': Image(shape=(512, 640, 3), dtype=uint8),
           
'state_dense': Tensor(shape=(7,), dtype=float32),
       
}),
   
}),
   
'task_code': string,
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
episódio_id tensor corda
habilidade tensor uint8
degraus conjunto de dados
passos/ação RecursosDict
passos/ação/close_gripper tensor bool
passos/ação/open_gripper tensor bool
passos/ação/target_pose tensor (7,) float32
passos/ação/encerrar tensor bool
passos/é_primeiro tensor bool
passos/é_último tensor bool
passos/is_terminal tensor bool
passos/observação RecursosDict
passos/observação/gripper_closed tensor bool
passos/observação/height_to_bottom tensor float32
passos/observação/imagem Imagem (512, 640, 3) uint8
passos/observação/estado_denso tensor (7,) float32
task_code tensor corda

mt_opt/sd

  • Descrição da configuração : o conjunto de dados de detectores de sucesso que contém definições de conclusão de tarefas com curadoria humana.

  • Tamanho do conjunto de dados : 548.56 GiB

  • Divisões :

Dividir Exemplos
'test' 94.636
'train' 380.234
  • Estrutura de recursos :
FeaturesDict({
   
'image_0': Image(shape=(512, 640, 3), dtype=uint8),
   
'image_1': Image(shape=(480, 640, 3), dtype=uint8),
   
'image_2': Image(shape=(480, 640, 3), dtype=uint8),
   
'success': bool,
   
'task_code': string,
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem_0 Imagem (512, 640, 3) uint8
imagem_1 Imagem (480, 640, 3) uint8
imagem_2 Imagem (480, 640, 3) uint8
sucesso tensor bool
task_code tensor corda