stl10

  • Mô tả:

Bộ dữ liệu STL-10 là bộ dữ liệu nhận dạng hình ảnh để phát triển các thuật toán học tập tính năng không giám sát, học sâu, học tự học. Nó được lấy cảm hứng từ bộ dữ liệu CIFAR-10 nhưng với một số sửa đổi. Đặc biệt, mỗi lớp có ít ví dụ đào tạo được gắn nhãn hơn trong CIFAR-10, nhưng một tập hợp rất lớn các ví dụ không được gắn nhãn được cung cấp để tìm hiểu các mô hình hình ảnh trước khi đào tạo có giám sát. Thách thức chính là tận dụng dữ liệu không được gắn nhãn (đến từ một phân phối tương tự nhưng khác với dữ liệu được gắn nhãn) để tạo ra một dữ liệu hữu ích trước đó. Tất cả hình ảnh được lấy từ các ví dụ có nhãn trên ImageNet.

Tách ra Các ví dụ
'test' 8.000
'train' 5.000
'unlabelled' 100.000
  • Các tính năng:
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})

Hình dung

  • Trích dẫn:
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}