- বর্ণনা :
PASS হল একটি বড় আকারের ইমেজ ডেটাসেট যাতে কোনো মানুষ, মানুষের অংশ বা অন্যান্য ব্যক্তিগতভাবে শনাক্তযোগ্য তথ্য অন্তর্ভুক্ত থাকে না। গোপনীয়তা সংক্রান্ত উদ্বেগগুলি উল্লেখযোগ্যভাবে হ্রাস করার সময় এটি উচ্চ-মানের স্ব-তত্ত্বাবধানে পূর্বপ্রশিক্ষণের জন্য ব্যবহার করা যেতে পারে।
PASS-এ YFCC-100M থেকে কোনো লেবেল ছাড়াই 1,439,589টি ছবি রয়েছে।
এই ডেটাসেটের সমস্ত ছবি CC-BY লাইসেন্সের অধীনে লাইসেন্সপ্রাপ্ত, যেমন ডেটাসেট নিজেই। YFCC-100M-এর জন্য http://www.multimediacommons.org/ দেখুন
সোর্স কোড :
tfds.datasets.pass.Builder
সংস্করণ :
-
1.0.0
: প্রাথমিক প্রকাশ। -
2.0.0
: v2: v1 থেকে 472টি ছবি সরিয়ে দেওয়া হয়েছে কারণ এতে মানুষ রয়েছে। এছাড়াও মেটাডেটা যোগ করা হয়েছে: তারিখ নেওয়া এবং GPS। -
3.0.0
(ডিফল্ট): v3: v2 থেকে 131টি ছবি সরানো হয়েছে কারণ এতে মানুষ/ট্যাটো রয়েছে।
-
ডাউনলোড আকার :
167.30 GiB
ডেটাসেটের আকার :
166.43 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,439,588 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
ইমেজ | ছবি | (কোনটিই নয়, 3) | uint8 | |
image/creator_unname | পাঠ্য | স্ট্রিং | ||
ছবি/তারিখ_গৃহীত | পাঠ্য | স্ট্রিং | ||
image/gps_lat | টেনসর | float32 | ||
image/gps_lon | টেনসর | float32 | ||
ছবি/হ্যাশ | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ):
- উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}