oxford_iiit_pet

  • বর্ণনা :

Oxford-IIIT পোষা প্রাণীর ডেটাসেট হল একটি 37 শ্রেণীর পোষা ইমেজ ডেটাসেট যার প্রতিটি ক্লাসের জন্য প্রায় 200টি ছবি রয়েছে। চিত্রগুলির স্কেল, ভঙ্গি এবং আলোতে বড় বৈচিত্র রয়েছে। সমস্ত ছবিতে জাত এবং প্রজাতির একটি সম্পর্কিত গ্রাউন্ড ট্রুথ টীকা রয়েছে। অতিরিক্তভাবে, প্রশিক্ষণ বিভাজনের জন্য হেড বাউন্ডিং বাক্স সরবরাহ করা হয়, যা সাধারণ বস্তু সনাক্তকরণের কাজগুলির জন্য এই ডেটাসেটটি ব্যবহার করার অনুমতি দেয়। পরীক্ষার বিভাজনে, বাউন্ডিং বাক্সগুলি খালি।

বিভক্ত উদাহরণ
'test' ৩,৬৬৯
'train' 3,680
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
ফাইল_নাম পাঠ্য স্ট্রিং
head_bbox বিবক্স ফিচার (৪,) float32
ইমেজ ছবি (কোনটিই নয়, 3) uint8
লেবেল ক্লাসলেবেল int64
সেগমেন্টেশন_মাস্ক ছবি (কোনটিই নয়, 1) uint8
প্রজাতি ক্লাসলেবেল int64
  • উদ্ধৃতি :
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}