
  • توضیحات :

ناوبری راهرو

تقسیم کنید نمونه ها
'train' 7,331
  • ساختار ویژگی :
'episode_metadata': FeaturesDict({
'file_path': Text(shape=(), dtype=string),
'steps': Dataset({
'action': Tensor(shape=(2,), dtype=float64, description=Robot action, consists of 2x position),
'action_angle': Tensor(shape=(3,), dtype=float64, description=Robot action, consists of 2x position, 1x yaw),
'discount': Scalar(shape=(), dtype=float64, description=Discount if provided, default to 1.),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),
'language_instruction': Text(shape=(), dtype=string),
'observation': FeaturesDict({
'image': Image(shape=(64, 85, 3), dtype=uint8, description=Main camera RGB observation.),
'position': Tensor(shape=(2,), dtype=float64, description=Robot position),
'state': Tensor(shape=(3,), dtype=float64, description=Robot state, consists of [2x position, 1x yaw]),
'yaw': Tensor(shape=(1,), dtype=float64, description=Robot yaw),
'reward': Scalar(shape=(), dtype=float64, description=Reward if provided, 1 on final step for demos.),
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D توضیحات
episode_metadata FeaturesDict
episode_metadata/file_path متن رشته مسیر فایل داده اصلی
مراحل مجموعه داده
مراحل/عمل تانسور (2،) float64 عمل ربات، از موقعیت 2x تشکیل شده است
Steps/Action_Angle تانسور (3،) float64 عمل ربات، شامل 2x موقعیت، 1x انحراف است
مراحل/تخفیف اسکالر float64 تخفیف در صورت ارائه، پیش فرض 1 است.
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
Steps/language_embedding تانسور (512،) float32 تعبیه زبان کونا. به https://tfhub.dev/google/universal-sentence-encoder-large/5 مراجعه کنید
مراحل/زبان_آموزش متن رشته آموزش زبان.
مراحل / مشاهده FeaturesDict
مراحل / مشاهده / تصویر تصویر (64، 85، 3) uint8 دوربین اصلی رصد RGB.
مراحل / مشاهده / موقعیت تانسور (2،) float64 موقعیت ربات
مراحل / مشاهده / حالت تانسور (3،) float64 حالت ربات، متشکل از [2x موقعیت، 1x انحراف]
مراحل / مشاهده / انحراف تانسور (1،) float64 ربات یاو
مراحل/پاداش اسکالر float64 در صورت ارائه پاداش، 1 در مرحله آخر برای دموها.
  • نقل قول :
={Self-supervised deep reinforcement learning with generalized computation graphs for robot navigation},
={Kahn, Gregory and Villaflor, Adam and Ding, Bosen and Abbeel, Pieter and Levine, Sergey},
={2018 IEEE international conference on robotics and automation (ICRA)},