cifar10_1

Bộ dữ liệu CIFAR-10.1 là bộ thử nghiệm mới cho CIFAR-10. CIFAR-10.1 chứa khoảng 2.000 hình ảnh thử nghiệm mới được lấy mẫu sau nhiều năm nghiên cứu trên tập dữ liệu CIFAR-10 ban đầu. Việc thu thập dữ liệu cho CIFAR-10.1 được thiết kế để giảm thiểu sự thay đổi phân phối so với tập dữ liệu ban đầu. Chúng tôi mô tả việc tạo CIFAR-10.1 trong bài báo "Bộ phân loại CIFAR-10 có tổng quát hóa thành CIFAR-10 không?". Các hình ảnh trong CIFAR-10.1 là một tập hợp con của tập dữ liệu TinyImages. Hiện tại có hai phiên bản của tập dữ liệu CIFAR-10.1: v4 và v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (32, 32, 3) tf.uint8
nhãn mác ClassLabel tf.int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1 / v4 (cấu hình mặc định)

  • Mô tả cấu hình : Đây là phiên bản đầu tiên của tập dữ liệu mà chúng tôi đã thử nghiệm bất kỳ bộ phân loại nào. Như đã đề cập ở trên, điều này làm cho tập dữ liệu v4 độc lập với các bộ phân loại mà chúng tôi đánh giá. Các con số được báo cáo trong các phần chính của bài báo của chúng tôi sử dụng phiên bản này của tập dữ liệu. Nó được xây dựng từ 25 từ khóa TinyImages hàng đầu cho mỗi lớp, điều này dẫn đến sự mất cân bằng lớp nhẹ. Sự khác biệt lớn nhất là tàu chỉ chiếm 8% trong bộ thử nghiệm thay vì 10%. v4 chứa 2.021 hình ảnh.

  • Kích thước tải xuống : 5.93 MiB

  • Kích thước tập dữ liệu : 4.46 MiB

  • Tách :

Tách ra Các ví dụ
'test' 2.021

cifar10_1 / v6

  • Mô tả cấu hình : Nó có nguồn gốc từ việc phân bổ từ khóa được cải thiện một chút và được cân bằng chính xác về lớp. Phiên bản này của tập dữ liệu tương ứng với kết quả trong Phụ lục D của bài báo của chúng tôi. v6 chứa 2.000 hình ảnh.

  • Kích thước tải xuống : 5.87 MiB

  • Kích thước tập dữ liệu : 4.40 MiB

  • Tách :

Tách ra Các ví dụ
'test' 2.000