מקומות מלאים

  • תיאור :

מערך הנתונים של מקומות עוצב בהתאם לעקרונות של קוגניציה חזותית אנושית. המטרה שלנו היא לבנות ליבה של ידע חזותי שניתן להשתמש בו כדי להכשיר מערכות מלאכותיות למשימות הבנה חזותית ברמה גבוהה, כגון הקשר של סצנה, זיהוי אובייקט, חיזוי פעולה ואירועים, והסקת תורת הנפש.

הקטגוריות הסמנטיות של מקומות מוגדרות לפי תפקידן: התוויות מייצגות את רמת הכניסה של סביבה. לשם המחשה, למערך הנתונים יש קטגוריות שונות של חדרי שינה, או רחובות וכו', מכיוון שלא פועלים באותה צורה, ואינם עושים את אותן תחזיות לגבי מה שיכול לקרות לאחר מכן, בחדר שינה בבית, בחדר שינה בבית מלון או בחדר ילדים. בסך הכל, מקומות מכילים יותר מ-10 מיליון תמונות הכוללות יותר מ-400 קטגוריות סצנות ייחודיות. מערך הנתונים כולל 5,000 עד 30,000 תמונות אימון בכל שיעור, בהתאם לתדירות ההתרחשות בעולם האמיתי. באמצעות רשתות עצביות קונבולוציוניות (CNN), מערך הנתונים של Places מאפשר למידה של תכונות סצינות עמוקות עבור משימות שונות של זיהוי סצינות, במטרה ליצור ביצועים חדישים חדשים על אמות מידה ממוקדות סצנה.

כאן אנו מספקים את מסד הנתונים של המקומות ואת ה-CNN המיומנים למטרות מחקר וחינוך אקדמיים.

לְפַצֵל דוגמאות
'train' 10,653,087
  • מבנה תכונה :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
שם קובץ טֶקסט חוּט
תמונה תמונה (256, 256, 3) uint8
תווית ClassLabel int64

רְאִיָה

  • ציטוט :
@article{zhou2017places,
  title={Places: A 10 million Image Database for Scene Recognition},
  author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2017},
  publisher={IEEE}
}