i_naturalist2021

  • Mô tả :

Bộ dữ liệu iNaturalist 2021 chứa tổng cộng 10.000 loài. Tập dữ liệu huấn luyện đầy đủ chứa gần 2,7 triệu hình ảnh. Để làm cho tập dữ liệu dễ tiếp cận hơn, chúng tôi cũng đã tạo một tập dữ liệu huấn luyện "nhỏ" với 50 ví dụ cho mỗi loài với tổng số 500 nghìn hình ảnh. Việc phân chia train luyện đầy đủ trùng lặp với phân chia mini . Bộ val chứa cho mỗi loài 10 hình ảnh xác thực (tổng cộng 100K). Có tổng cộng 500.000 hình ảnh thử nghiệm trong phần chia public_test (không có nhãn sự thật).

Tách ra Ví dụ
'mini' 500.000
'test' 500.000
'train' 2.686.843
'val' 100.000
  • Cấu trúc tính năng :
FeaturesDict({
    'file_id': Text(shape=(), dtype=string),
    'id': Scalar(shape=(), dtype=int64),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10000),
    'supercategory': ClassLabel(shape=(), dtype=int64, num_classes=11),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
file_id Chữ sợi dây
nhận dạng Vô hướng int64
hình ảnh Hình ảnh (Không, Không, 3) uint8
nhãn Nhãn lớp int64
siêu thể loại Nhãn lớp int64

Hình dung

  • Trích dẫn :
\
@misc{inaturalist21,
    Howpublished = {~\url{https://github.com/visipedia/inat_comp/tree/master/2021} },
    Title = { {iNaturalist} 2021 competition dataset.},
    Year = {2021},
    key = { {iNaturalist} 2021 competition dataset},
    }