caltech101

  • Mô tả:

Caltech-101 bao gồm hình ảnh của các đối tượng thuộc lớp 101, cộng với một background clutter lớp. Mỗi hình ảnh được gắn nhãn với một đối tượng duy nhất. Mỗi lớp chứa khoảng 40 đến 800 hình ảnh, tổng cộng khoảng 9k hình ảnh. Hình ảnh có kích thước thay đổi, với độ dài cạnh điển hình là 200-300 pixel. Phiên bản này chỉ chứa các nhãn cấp hình ảnh. Tập dữ liệu ban đầu cũng chứa các hộp giới hạn.

Tách ra Các ví dụ
'test' 6,084
'train' 3.060
  • Các tính năng:
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/file_name': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=102),
})

Hình dung

  • Trích dẫn:
@article{FeiFei2004LearningGV,
  title={Learning Generative Visual Models from Few Training Examples: An Incremental Bayesian Approach Tested on 101 Object Categories},
  author={Li Fei-Fei and Rob Fergus and Pietro Perona},
  journal={Computer Vision and Pattern Recognition Workshop},
  year={2004},
}