imagenet2012_real

Bộ dữ liệu này chứa các hình ảnh xác thực ILSVRC-2012 (ImageNet) được tăng cường bằng một bộ nhãn "Đánh giá lại" (Real) mới từ bài báo "Chúng ta đã hoàn thành với ImageNet chưa", xem https://arxiv.org/abs/2006.07159 các nhãn được thu thập bằng cách sử dụng giao thức nâng cao, dẫn đến các chú thích đa nhãn và chính xác hơn.

Lưu ý quan trọng: khoảng 3500 ví dụ không chứa nhãn, chúng nên được loại trừ khỏi giá trị trung bình khi tính toán độ chính xác . Một cách khả thi để thực hiện việc này là sử dụng mã NumPy sau:

is_correct = [pred in real_labels[i] for i, pred in enumerate(predictions) if real_labels[i]]
real_accuracy = np.mean(is_correct)
  • Trang chủ : https://github.com/google-research/reassessed-imagenet

  • Mã nguồn : tfds.datasets.imagenet2012_real.Builder

  • Phiên bản :

    • 1.0.0 (mặc định): Bản phát hành đầu tiên
  • Kích thước tải xuống : 379.37 KiB

  • Kích thước tập dữ liệu : 6.25 GiB

  • Hướng dẫn tải xuống thủ công : Bộ dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir phải chứa tệp ILSVRC2012_img_val.tar . Bạn cần đăng ký trên http://www.image-net.org/download-images để nhận liên kết tải xuống tập dữ liệu.

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'validation' 50.000
  • Cấu trúc tính năng :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'original_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'real_label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1000)),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tên_tệp Chữ sợi dây
hình ảnh Hình ảnh (Không, Không có, 3) uint8
original_label LớpNhãn int64
real_label Trình tự (Nhãn lớp) (Không có,) int64

Hình dung

  • trích dẫn :
@article{beyer2020imagenet,
  title={Are we done with ImageNet?},
  author={Lucas Beyer and Olivier J. Henaff and Alexander Kolesnikov and Xiaohua Zhai and Aaron van den Oord},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author={Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title={ {ImageNet Large Scale Visual Recognition Challenge} },
  Year={2015},
  journal={International Journal of Computer Vision (IJCV)},
  doi={10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}