- বর্ণনা :
স্থানের ডেটাসেটটি মানুষের চাক্ষুষ জ্ঞানের নীতি অনুসরণ করে ডিজাইন করা হয়েছে। আমাদের লক্ষ্য হল ভিজ্যুয়াল জ্ঞানের একটি মূল তৈরি করা যা উচ্চ-স্তরের ভিজ্যুয়াল বোঝার কাজগুলির জন্য কৃত্রিম সিস্টেমগুলিকে প্রশিক্ষণ দিতে ব্যবহার করা যেতে পারে, যেমন দৃশ্যের প্রসঙ্গ, বস্তুর স্বীকৃতি, ক্রিয়া এবং ঘটনার পূর্বাভাস এবং তত্ত্ব-অব-মনের অনুমান।
স্থানগুলির শব্দার্থগত বিভাগগুলি তাদের ফাংশন দ্বারা সংজ্ঞায়িত করা হয়: লেবেলগুলি পরিবেশের প্রবেশ-স্তরের প্রতিনিধিত্ব করে। ব্যাখ্যা করার জন্য, ডেটাসেটের বিভিন্ন শ্রেণীর শয়নকক্ষ, বা রাস্তা ইত্যাদি রয়েছে, কারণ কেউ একইভাবে কাজ করে না এবং বাড়ির বেডরুমে, হোটেলের বেডরুমে বা নার্সারিতে কী ঘটতে পারে তার একই ভবিষ্যদ্বাণী করে না। মোট, স্থানগুলিতে 400+ অনন্য দৃশ্য বিভাগ সমন্বিত 10 মিলিয়নেরও বেশি চিত্র রয়েছে৷ ডেটাসেটটিতে প্রতি শ্রেণীতে 5000 থেকে 30,000টি প্রশিক্ষণ চিত্র রয়েছে, যা বাস্তব-বিশ্বের সংঘটনের ফ্রিকোয়েন্সির সাথে সামঞ্জস্যপূর্ণ। কনভোল্যুশনাল নিউরাল নেটওয়ার্ক (CNN) ব্যবহার করে, স্থানের ডেটাসেট দৃশ্য-কেন্দ্রিক বেঞ্চমার্কে নতুন অত্যাধুনিক পারফরম্যান্স স্থাপনের লক্ষ্যে বিভিন্ন দৃশ্য শনাক্তকরণ কাজের জন্য গভীর দৃশ্যের বৈশিষ্ট্যগুলি শেখার অনুমতি দেয়।
এখানে আমরা একাডেমিক গবেষণা এবং শিক্ষার উদ্দেশ্যে স্থান ডেটাবেস এবং প্রশিক্ষিত CNN প্রদান করি।
হোমপেজ : http://places2.csail.mit.edu/
সোর্স কোড :
tfds.datasets.placesfull.Builderসংস্করণ :
-
1.0.0(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড আকার :
143.56 GiBডেটাসেটের আকার :
136.56 GiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 10,653,087 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'filename': Text(shape=(), dtype=string),
'image': Image(shape=(256, 256, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| ফাইলের নাম | পাঠ্য | স্ট্রিং | ||
| ইমেজ | ছবি | (256, 256, 3) | uint8 | |
| লেবেল | ক্লাসলেবেল | int64 |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):('image', 'label', 'filename')চিত্র ( tfds.show_examples ):

- উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@article{zhou2017places,
title={Places: A 10 million Image Database for Scene Recognition},
author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
year={2017},
publisher={IEEE}
}