- Mô tả :
ImageNet-LT là tập hợp con của bộ dữ liệu ImageNet ILSVRC 2012 gốc. Tập huấn luyện được lấy mẫu con sao cho số lượng hình ảnh trên mỗi lớp tuân theo phân phối đuôi dài. Lớp có số lượng hình ảnh tối đa chứa 1.280 ví dụ, trong khi lớp có số lượng hình ảnh tối thiểu chỉ chứa 5 ví dụ. Bộ dữ liệu cũng có một bộ xác thực cân bằng, cũng là một tập hợp con của bộ đào tạo ImageNet ILSVRC 2012 và chứa 20 hình ảnh cho mỗi lớp. Tập kiểm tra của tập dữ liệu này giống với tập xác thực của tập dữ liệu ImageNet ILSVRC 2012 ban đầu.
Tập dữ liệu gốc ImageNet ILSVRC 2012 phải được tải xuống theo cách thủ công và đường dẫn của nó phải được đặt bằng --manual_dir để tạo tập dữ liệu này.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://github.com/zhmiao/OpenLongTailRecognition-OLTR
Mã nguồn :
tfds.datasets.imagenet_lt.Builder
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
5.21 MiB
Kích thước tập dữ liệu :
20.92 GiB
Hướng dẫn tải xuống thủ công : Bộ dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào
download_config.manual_dir
(mặc định là~/tensorflow_datasets/downloads/manual/
):
manual_dir phải chứa hai tệp: ILSVRC2012_img_train.tar và ILSVRC2012_img_val.tar. Bạn cần đăng ký trên http://www.image-net.org/download-images để nhận liên kết tải xuống tập dữ liệu.Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 50.000 |
'train' | 115,846 |
'validation' | 20.000 |
- Cấu trúc tính năng :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
tên_tệp | Chữ | sợi dây | ||
hình ảnh | Hình ảnh | (Không, Không có, 3) | uint8 | |
nhãn mác | LớpNhãn | int64 |
Các khóa được giám sát (Xem
as_supervised
doc ):('image', 'label')
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
\
@inproceedings{openlongtailrecognition,
title={Large-Scale Long-Tailed Recognition in an Open World},
author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2019},
url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}