- תיאור :
מערך הנתונים של מקומות עוצב בהתאם לעקרונות של קוגניציה חזותית אנושית. המטרה שלנו היא לבנות ליבה של ידע חזותי שניתן להשתמש בו כדי להכשיר מערכות מלאכותיות למשימות הבנה חזותית ברמה גבוהה, כגון הקשר של סצנה, זיהוי אובייקט, חיזוי פעולה ואירועים, והסקת תורת הנפש.
הקטגוריות הסמנטיות של מקומות מוגדרות לפי תפקידן: התוויות מייצגות את רמת הכניסה של סביבה. לשם המחשה, למערך הנתונים יש קטגוריות שונות של חדרי שינה, או רחובות וכו', מכיוון שלא פועלים באותה צורה, ואינם עושים את אותן תחזיות לגבי מה שיכול לקרות לאחר מכן, בחדר שינה בבית, בחדר שינה בבית מלון או בחדר ילדים. בסך הכל, מקומות מכילים יותר מ-10 מיליון תמונות הכוללות יותר מ-400 קטגוריות סצנות ייחודיות. מערך הנתונים כולל 5,000 עד 30,000 תמונות אימון בכל שיעור, בהתאם לתדירות ההתרחשות בעולם האמיתי. באמצעות רשתות עצביות קונבולוציוניות (CNN), מערך הנתונים של Places מאפשר למידה של תכונות סצינות עמוקות עבור משימות שונות של זיהוי סצינות, במטרה ליצור ביצועים חדישים חדשים על אמות מידה ממוקדות סצנה.
כאן אנו מספקים את מסד הנתונים של המקומות ואת ה-CNN המיומנים למטרות מחקר וחינוך אקדמיים.
דף הבית : http://places2.csail.mit.edu/
קוד מקור :
tfds.datasets.placesfull.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
143.56 GiB
גודל מערך נתונים :
136.56 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 10,653,087 |
- מבנה תכונה :
FeaturesDict({
'filename': Text(shape=(), dtype=string),
'image': Image(shape=(256, 256, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
שם קובץ | טֶקסט | חוּט | ||
תמונה | תמונה | (256, 256, 3) | uint8 | |
תווית | ClassLabel | int64 |
מפתחות בפיקוח (ראה
as_supervised
doc ):('image', 'label', 'filename')
איור ( tfds.show_examples ):
- דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@article{zhou2017places,
title={Places: A 10 million Image Database for Scene Recognition},
author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
year={2017},
publisher={IEEE}
}