wake_vision

  • বর্ণনা :

ওয়েক ভিশন হল একটি বড়, উচ্চ-মানের ডেটাসেট যা 6 মিলিয়নেরও বেশি ছবি সমন্বিত করে, যা বর্তমান টিনিএমএল ডেটাসেটের (100x) স্কেল এবং বৈচিত্র্যকে উল্লেখযোগ্যভাবে অতিক্রম করে। এই ডেটাসেটে প্রতিটি ছবিতে একজন ব্যক্তি আছে কিনা তার টীকা সহ ছবি অন্তর্ভুক্ত করে। উপরন্তু, এটি ন্যায্যতা এবং দৃঢ়তা মূল্যায়ন করার জন্য একটি ব্যাপক সূক্ষ্ম-দানাযুক্ত বেঞ্চমার্ক অন্তর্ভুক্ত করে, অনুভূত লিঙ্গ, অনুভূত বয়স, বিষয়ের দূরত্ব, আলোর অবস্থা এবং চিত্রণগুলিকে কভার করে। ওয়েক ভিশন লেবেলগুলি ওপেন ইমেজের টীকা থেকে নেওয়া হয়েছে যা CC BY 4.0 লাইসেন্সের অধীনে Google LLC দ্বারা লাইসেন্সপ্রাপ্ত৷ ছবিগুলিকে একটি CC BY 2.0 লাইসেন্স আছে বলে তালিকাভুক্ত করা হয়েছে৷ ওপেন ইমেজ থেকে দ্রষ্টব্য: "যদিও আমরা ক্রিয়েটিভ কমন্স অ্যাট্রিবিউশন লাইসেন্সের অধীনে লাইসেন্সপ্রাপ্ত ছবিগুলি সনাক্ত করার চেষ্টা করেছি, আমরা প্রতিটি ছবির লাইসেন্সের স্থিতির বিষয়ে কোনও উপস্থাপনা বা ওয়ারেন্টি দিই না এবং প্রতিটি ছবির লাইসেন্স আপনার নিজেরই যাচাই করা উচিত।"

  • হোমপেজ : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC

  • সোর্স কোড : tfds.datasets.wake_vision.Builder

  • সংস্করণ :

    • 1.0.0 (ডিফল্ট): প্রাথমিক টেনসরফ্লো ডেটাসেট প্রকাশ। মনে রাখবেন যে এটি হার্ভার্ড ডেটাভার্সে ওয়েক ভিশনের 2.0 সংস্করণের উপর ভিত্তি করে তৈরি।
  • ডাউনলোড আকার : Unknown size

  • ডেটাসেটের আকার : 239.25 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 55,763
'train_large' 5,760,428
'train_quality' 1,248,230
'validation' 18,582
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
বয়স_অজানা ক্লাসলেবেল int64
শরীরের_অংশ ক্লাসলেবেল int64
উজ্জ্বল ক্লাসলেবেল int64
অন্ধকার ক্লাসলেবেল int64
চিত্রণ ক্লাসলেবেল int64
দূরে ক্লাসলেবেল int64
ফাইলের নাম পাঠ্য স্ট্রিং
লিঙ্গ_অজানা ক্লাসলেবেল int64
ইমেজ ছবি (কোনটিই নয়, 3) uint8
মধ্যম_দূরত্ব ক্লাসলেবেল int64
মধ্য_বয়স ক্লাসলেবেল int64
কাছাকাছি ক্লাসলেবেল int64
অ-ব্যক্তি_চিত্র ক্লাসলেবেল int64
অ-ব্যক্তি_অ-চিত্রণ ক্লাসলেবেল int64
স্বাভাবিক_আলো ক্লাসলেবেল int64
পুরোনো ক্লাসলেবেল int64
ব্যক্তি ক্লাসলেবেল int64
ব্যক্তি_চিত্র ক্লাসলেবেল int64
প্রধানত_মহিলা ক্লাসলেবেল int64
প্রধানত_পুরুষ ক্লাসলেবেল int64
তরুণ ক্লাসলেবেল int64

ভিজ্যুয়ালাইজেশন

  • উদ্ধৃতি :
@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}