
  • বর্ণনা :

ফ্রাঙ্কা অগ্রহণযোগ্য বস্তুর কারসাজি করছে

বিভক্ত উদাহরণ
'train' 201
  • বৈশিষ্ট্য গঠন :
'episode_metadata': FeaturesDict({
'file_path': Text(shape=(), dtype=string),
'steps': Dataset({
'action': Tensor(shape=(20,), dtype=float32, description=Robot action, consists of [3x end-effector position residual, 3x end-effector axis-angle residual, 7x robot joint k_p gain coefficient, 7x robot joint damping ratio coefficient].The action residuals are global, i.e. multiplied on theleft-hand side of the current end-effector state.),
'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),
'language_instruction': Text(shape=(), dtype=string),
'observation': FeaturesDict({
'image': Image(shape=(480, 640, 3), dtype=uint8, description=Main camera RGB observation.),
'partial_pointcloud': Tensor(shape=(512, 3), dtype=float32, description=Partial pointcloud observation),
'state': Tensor(shape=(21,), dtype=float32, description=Robot state, consists of [joint_states, end_effector_pose].Joint states are 14-dimensional, formatted in the order of [q_0, w_0, q_1, w_0, ...].In other words,  joint positions and velocities are interleaved.The end-effector pose is 7-dimensional, formatted in the order of [position, quaternion].The quaternion is formatted in (x,y,z,w) order. The end-effector pose references the tool frame, in the center of the two fingers of the gripper.),
'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
episode_metadata ফিচারসডিক্ট
episode_metadata/file_path পাঠ্য স্ট্রিং মূল ডেটা ফাইলের পথ।
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (20,) float32 রোবট অ্যাকশনের মধ্যে রয়েছে [3x এন্ড-ইফেক্টর পজিশন রেসিডুয়াল, 3x এন্ড-ইফেক্টর এক্সিস-এঙ্গেল রেসিডুয়াল, 7x রোবট জয়েন্ট k_p গেইন কোফিসিয়েন্ট, 7x রোবট জয়েন্ট ড্যাম্পিং রেশিও কোফিসিয়েন্ট]। অ্যাকশনের অবশিষ্টাংশগুলি গ্লোবাল, অর্থাৎ বাম দিকে গুন করা হয় বর্তমান শেষ-প্রভাবক অবস্থার।
পদক্ষেপ/ছাড় স্কেলার float32 ডিসকাউন্ট দেওয়া হলে, ডিফল্ট 1.
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/ভাষা_এম্বেডিং টেনসর (512,) float32 কোন ভাষা এম্বেডিং. https://tfhub.dev/google/universal-sentence-encoder-large/5 দেখুন
পদক্ষেপ/ভাষা_নির্দেশ পাঠ্য স্ট্রিং ভাষার নির্দেশনা।
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/চিত্র ছবি (480, 640, 3) uint8 প্রধান ক্যামেরা আরজিবি পর্যবেক্ষণ।
পদক্ষেপ/পর্যবেক্ষণ/আংশিক_পয়েন্টক্লাউড টেনসর (512, 3) float32 আংশিক পয়েন্টক্লাউড পর্যবেক্ষণ
পদক্ষেপ/পর্যবেক্ষণ/রাষ্ট্র টেনসর (২১,) float32 রোবট স্টেট, [joint_states, end_efector_pose] নিয়ে গঠিত। জয়েন্ট স্টেটগুলি 14-মাত্রিক, [q_0, w_0, q_1, w_0, ...] এর ক্রম অনুসারে বিন্যাসিত। অন্য কথায়, যৌথ অবস্থান এবং বেগ পরস্পর বিভক্ত। শেষ ইফেক্টর ভঙ্গি হল 7-মাত্রিক, [পজিশন, কোয়াটারনিয়ন] এর ক্রম অনুসারে ফর্ম্যাট করা হয়েছে। কোয়াটারনিয়নটি (x,y,z,w) ক্রমে ফর্ম্যাট করা হয়েছে। গ্রিপারের দুই আঙ্গুলের মাঝখানে এন্ড-ইফেক্টর ভঙ্গি টুল ফ্রেমকে নির্দেশ করে।
পদক্ষেপ/পুরস্কার স্কেলার float32 প্রদান করা হলে পুরস্কার, ডেমোর জন্য চূড়ান্ত ধাপে 1।
  • উদ্ধৃতি :
={Pre-and post-contact policy decomposition for non-prehensile manipulation with zero-shot sim-to-real transfer},
={Kim, Minchan and Han, Junhyek and Kim, Jaehyung and Kim, Beomjoon},
={2023 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)},