- Mô tả :
Imagenet2012Fewshot là một tập con của tập dữ liệu ImageNet ILSVRC 2012 gốc. Tập dữ liệu chia sẻ cùng một tập hợp xác thực như tập dữ liệu ImageNet ILSVRC 2012 ban đầu. Tuy nhiên, tập huấn luyện được lấy mẫu con theo kiểu cân bằng nhãn. Trong cấu hình 5shot
, 5 hình ảnh trên mỗi nhãn hoặc 5000 hình ảnh được lấy mẫu; và trong 10shot
hình 10 ảnh, 10 ảnh trên mỗi nhãn hoặc 10000 ảnh được lấy mẫu.
Trang chủ : http://image-net.org/
Các phiên bản :
-
2.0.0
: Sửa nhãn xác thực. -
2.0.1
: Sửa lỗi mã hóa. Không có thay đổi từ quan điểm của người dùng. 3.0.0
: Sửa lỗi màu trên ~ 12 hình ảnh (CMYK -> RGB). Sửa định dạng cho nhất quán (chuyển đổi hình ảnh png đơn thành Jpeg). Đọc thế hệ nhanh hơn trực tiếp từ kho lưu trữ.4.0.0
: (chưa xuất bản)5.0.0
: API phân tách mới ( https://tensorflow.org/datasets/splits )5.0.1
(mặc định): Không có ghi chú phát hành.5.1.0
: Đã thêm phần tách thử nghiệm.
-
Kích thước tải xuống :
Unknown size
Hướng dẫn tải xuống thủ công: Tập dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào
download_config.manual_dir
(mặc định là~/tensorflow_datasets/downloads/manual/
):
manual_dir phải chứa hai tệp: ILSVRC2012_img_train.tar và ILSVRC2012_img_val.tar. Bạn cần đăng ký trên https://image-net.org/download-images để có được liên kết tải xuống bộ dữ liệu.Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Cấu trúc tính năng :
FeaturesDict({
'file_name': Text(shape=(), dtype=tf.string),
'image': Image(shape=(None, None, 3), dtype=tf.uint8),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự mô tả |
---|---|---|---|---|
Các tính năng | ||||
tên_tệp | Chữ | tf.string | ||
hình ảnh | Hình ảnh | (Không có, Không có, 3) | tf.uint8 | |
nhãn mác | ClassLabel | tf.int64 |
Khóa được giám sát (Xem
as_supervised
doc ):('image', 'label')
Trích dẫn :
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_fewshot / 1shot (cấu hình mặc định)
Mô tả cấu hình : 1 ảnh chụp tổng số tập huấn luyện ImageNet.
Kích thước tập dữ liệu :
6.46 GiB
Tách :
Tách ra | Các ví dụ |
---|---|
'train' | 1.000 |
'tune' | 1.000 |
'validation' | 50.000 |
- Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
imagenet2012_fewshot / 5shot
Mô tả cấu hình : Ảnh chụp tổng số tập huấn luyện ImageNet.
Kích thước tập dữ liệu :
6.88 GiB
Tách :
Tách ra | Các ví dụ |
---|---|
'train' | 5.000 |
'tune' | 1.000 |
'validation' | 50.000 |
- Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
imagenet2012_fewshot / 10shot
Mô tả cấu hình : 10 ảnh chụp của tổng số tập huấn luyện ImageNet.
Kích thước tập dữ liệu :
7.42 GiB
Tách :
Tách ra | Các ví dụ |
---|---|
'train' | 10.000 |
'tune' | 1.000 |
'validation' | 50.000 |
- Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):