আকার3d

3dshapes হল 3D আকারের একটি ডেটাসেট যা পদ্ধতিগতভাবে 6টি গ্রাউন্ড ট্রুথ স্বাধীন সুপ্ত ফ্যাক্টর থেকে তৈরি হয়। এই কারণগুলি হল মেঝে রঙ , দেয়ালের রঙ , বস্তুর রঙ , স্কেল , আকৃতি এবং অভিযোজন

এই ল্যাটেন্টগুলির সমস্ত সম্ভাব্য সংমিশ্রণ ঠিক একবার উপস্থিত হয়, N = 480000 মোট ছবি তৈরি করে।

সুপ্ত ফ্যাক্টর মান

  • ফ্লোর হিউ: 10 মান রৈখিকভাবে ব্যবধানে [0, 1]
  • প্রাচীরের আভা: 10 মান রৈখিকভাবে [0, 1] এ ব্যবধানে
  • বস্তুর রঙ: 10 মান রৈখিকভাবে ব্যবধানে [0, 1]
  • স্কেল: 8 মান রৈখিকভাবে ব্যবধানে [0, 1]
  • আকৃতি: [0, 1, 2, 3] এ 4টি মান
  • স্থিতিবিন্যাস: 15টি মান রৈখিকভাবে ব্যবধানে [-30, 30]

আমরা এক সময়ে একটি সুপ্ত পরিবর্তন করেছি (অভিযোজন থেকে শুরু করে, তারপরে আকৃতি, ইত্যাদি), এবং ক্রমানুসারে চিত্রগুলিকে images অ্যারেতে নির্দিষ্ট ক্রমে সংরক্ষণ করেছি। ফ্যাক্টরগুলির সংশ্লিষ্ট মানগুলি labels অ্যারেতে একই ক্রমে সংরক্ষণ করা হয়।

বিভক্ত উদাহরণ
'train' 480,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
ইমেজ ছবি (৬৪, ৬৪, ৩) uint8
label_floor_hue ক্লাসলেবেল int64
label_object_hue ক্লাসলেবেল int64
লেবেল_ওরিয়েন্টেশন ক্লাসলেবেল int64
লেবেল_স্কেল ক্লাসলেবেল int64
লেবেল_আকৃতি ক্লাসলেবেল int64
label_wall_hue ক্লাসলেবেল int64
মান_তল_আভা টেনসর float32
value_object_hue টেনসর float32
মান_ওরিয়েন্টেশন টেনসর float32
মান_স্কেল টেনসর float32
মান_আকৃতি টেনসর float32
value_wall_hue টেনসর float32

ভিজ্যুয়ালাইজেশন

  • উদ্ধৃতি :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}