- Mô tả :
Bộ dữ liệu Stanford Dogs chứa hình ảnh của 120 giống chó từ khắp nơi trên thế giới. Tập dữ liệu này đã được xây dựng bằng cách sử dụng hình ảnh và chú thích từ ImageNet cho nhiệm vụ phân loại hình ảnh chi tiết. Có 20.580 hình ảnh, trong đó 12.000 hình ảnh được sử dụng để đào tạo và 8580 hình ảnh để thử nghiệm. Nhãn lớp và chú thích hộp giới hạn được cung cấp cho tất cả 12.000 hình ảnh.
Trang chủ : http://vision.stanford.edu/aditya86/ImageNetDogs/main.html
Mã nguồn :
tfds.image_classification.StanfordDogs
Các phiên bản :
-
0.2.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
778.12 MiB
Kích thước tập dữ liệu :
Unknown size
Tự động lưu trong bộ nhớ đệm ( tài liệu ): Không xác định
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 8.580 |
'train' | 12.000 |
- Các tính năng :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=tf.uint8),
'image/filename': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=120),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
}),
})
Khóa được giám sát (Xem
as_supervised
doc ):('image', 'label')
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@inproceedings{KhoslaYaoJayadevaprakashFeiFei_FGVC2011,
author = "Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and
Li Fei-Fei",
title = "Novel Dataset for Fine-Grained Image Categorization",
booktitle = "First Workshop on Fine-Grained Visual Categorization,
IEEE Conference on Computer Vision and Pattern Recognition",
year = "2011",
month = "June",
address = "Colorado Springs, CO",
}
@inproceedings{imagenet_cvpr09,
AUTHOR = {Deng, J. and Dong, W. and Socher, R. and Li, L.-J. and
Li, K. and Fei-Fei, L.},
TITLE = { {ImageNet: A Large-Scale Hierarchical Image Database} },
BOOKTITLE = {CVPR09},
YEAR = {2009},
BIBSOURCE = "http://www.image-net.org/papers/imagenet_cvpr09.bib"}