viola

  • Descrição :

Robô Franka interagindo com tarefas de cozinha estilizadas

Dividir Exemplos
'test' 15
'train' 135
  • Estrutura de recursos :
FeaturesDict({
   
'steps': Dataset({
       
'action': FeaturesDict({
           
'gripper_closedness_action': float32,
           
'rotation_delta': Tensor(shape=(3,), dtype=float32),
           
'terminate_episode': float32,
           
'world_vector': Tensor(shape=(3,), dtype=float32),
       
}),
       
'is_first': bool,
       
'is_last': bool,
       
'is_terminal': bool,
       
'observation': FeaturesDict({
           
'agentview_rgb': Image(shape=(224, 224, 3), dtype=uint8),
           
'ee_states': Tensor(shape=(16,), dtype=float32),
           
'eye_in_hand_rgb': Image(shape=(224, 224, 3), dtype=uint8),
           
'gripper_states': Tensor(shape=(1,), dtype=float32),
           
'joint_states': Tensor(shape=(7,), dtype=float32),
           
'natural_language_embedding': Tensor(shape=(512,), dtype=float32),
           
'natural_language_instruction': string,
       
}),
       
'reward': Scalar(shape=(), dtype=float32),
   
}),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
passos Conjunto de dados
etapas/ação RecursosDict
etapas/ação/gripper_closedness_action Tensor float32
etapas/ação/rotação_delta Tensor (3,) float32
etapas/ação/terminar_episódio Tensor float32
passos/ação/vetor_mundo Tensor (3,) float32
passos/é_primeiro Tensor bool
passos/é_último Tensor bool
etapas/is_terminal Tensor bool
etapas/observação RecursosDict
etapas/observação/agentview_rgb Imagem (224, 224, 3) uint8 RGB capturado pela câmera do espaço de trabalho
etapas/observação/ee_states Tensor (16,) float32 Pose do efetor final especificado como uma matriz homogênea.
passos/observação/eye_in_hand_rgb Imagem (224, 224, 3) uint8 RGB capturado pela câmera na mão
etapas/observação/gripper_states Tensor (1,) float32 gripper_states = 0 significa que a garra está totalmente fechada. O valor representa a largura da pinça Franka Panda Gripper.
etapas/observação/joint_states Tensor (7,) float32 valores conjuntos
etapas/observação/integração_de_linguagem_natural Tensor (512,) float32
etapas/observação/instrução_de_linguagem_natural Tensor corda
passos/recompensa Escalar float32
@article{zhu2022viola,
  title
={VIOLA: Imitation Learning for Vision-Based Manipulation with Object Proposal Priors},
  author
={Zhu, Yifeng and Joshi, Abhishek and Stone, Peter and Zhu, Yuke},
  journal
={6th Annual Conference on Robot Learning (CoRL)},
  year
={2022}
}