imagenet_lt

  • Mô tả :

ImageNet-LT là tập hợp con của bộ dữ liệu ImageNet ILSVRC 2012 gốc. Tập huấn luyện được lấy mẫu con sao cho số lượng hình ảnh trên mỗi lớp tuân theo phân phối đuôi dài. Lớp có số lượng hình ảnh tối đa chứa 1.280 ví dụ, trong khi lớp có số lượng hình ảnh tối thiểu chỉ chứa 5 ví dụ. Bộ dữ liệu cũng có một bộ xác thực cân bằng, cũng là một tập hợp con của bộ đào tạo ImageNet ILSVRC 2012 và chứa 20 hình ảnh cho mỗi lớp. Tập kiểm tra của tập dữ liệu này giống với tập xác thực của tập dữ liệu ImageNet ILSVRC 2012 ban đầu.

Tập dữ liệu gốc ImageNet ILSVRC 2012 phải được tải xuống theo cách thủ công và đường dẫn của nó phải được đặt bằng --manual_dir để tạo tập dữ liệu này.

Tách ra ví dụ
'test' 50.000
'train' 115,846
'validation' 20.000
  • Cấu trúc tính năng :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tên_tệp Chữ sợi dây
hình ảnh Hình ảnh (Không, Không có, 3) uint8
nhãn mác LớpNhãn int64

Hình dung

  • trích dẫn :
\
@inproceedings{openlongtailrecognition,
  title={Large-Scale Long-Tailed Recognition in an Open World},
  author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
  booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2019},
  url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}