- توضیحات :
مجموعه داده STL-10 یک مجموعه داده تشخیص تصویر برای توسعه الگوریتم های یادگیری ویژگی های بدون نظارت، یادگیری عمیق و یادگیری خودآموز است. از مجموعه داده CIFAR-10 الهام گرفته شده است اما با برخی تغییرات. به طور خاص، هر کلاس نمونه های آموزشی برچسب گذاری شده کمتری نسبت به CIFAR-10 دارد، اما مجموعه بسیار بزرگی از نمونه های بدون برچسب برای یادگیری مدل های تصویر قبل از آموزش نظارت شده ارائه شده است. چالش اصلی استفاده از دادههای بدون برچسب (که از توزیع مشابه اما متفاوت از دادههای برچسبگذاری شده به دست میآید) برای ایجاد یک پیشین مفید است. همه تصاویر از نمونه های برچسب گذاری شده در ImageNet به دست آمده اند.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://ai.stanford.edu/~acoates/stl10/
کد منبع :
tfds.datasets.stl10.Builder
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
2.46 GiB
حجم مجموعه داده :
1.86 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 8000 |
'train' | 5000 |
'unlabelled' | 100000 |
- ساختار ویژگی :
FeaturesDict({
'image': Image(shape=(96, 96, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
تصویر | تصویر | (96، 96، 3) | uint8 | |
برچسب | ClassLabel | int64 |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('image', 'label')
شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{coates2011stl10,
title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
author={Coates, Adam and Ng, Andrew and Lee, Honglak},
booktitle={AISTATS},
year={2011},
note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}