- תיאור :
מערך הנתונים STL-10 הוא מערך נתונים לזיהוי תמונות לפיתוח אלגוריתמי למידה ללא פיקוח, למידה עמוקה, אוטודידקט. זה בהשראת מערך הנתונים CIFAR-10 אך עם כמה שינויים. בפרט, לכל כיתה יש פחות דוגמאות הדרכה מתויגות מאשר ב-CIFAR-10, אך קבוצה גדולה מאוד של דוגמאות ללא תווית מסופקת כדי ללמוד מודלים של תמונה לפני אימון בפיקוח. האתגר העיקרי הוא לעשות שימוש בנתונים שאינם מסומנים (שמגיעים מהתפלגות דומה אך שונה מהנתונים המסומנים) כדי לבנות פריור שימושי. כל התמונות נרכשו מדוגמאות שכותרתו ב-ImageNet.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : http://ai.stanford.edu/~acoates/stl10/
קוד מקור :
tfds.datasets.stl10.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
2.46 GiB
גודל מערך נתונים :
1.86 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 8,000 |
'train' | 5,000 |
'unlabelled' | 100,000 |
- מבנה תכונה :
FeaturesDict({
'image': Image(shape=(96, 96, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תמונה | תמונה | (96, 96, 3) | uint8 | |
תווית | ClassLabel | int64 |
מפתחות בפיקוח (ראה
as_supervised
doc ):('image', 'label')
איור ( tfds.show_examples ):
- דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@inproceedings{coates2011stl10,
title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
author={Coates, Adam and Ng, Andrew and Lee, Honglak},
booktitle={AISTATS},
year={2011},
note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}