vượt qua

  • Sự miêu tả :

PASS là tập dữ liệu hình ảnh quy mô lớn không bao gồm bất kỳ con người, bộ phận cơ thể người hoặc thông tin nhận dạng cá nhân nào khác. Nó có thể được sử dụng để đào tạo trước tự giám sát chất lượng cao đồng thời giảm đáng kể những lo ngại về quyền riêng tư.

PASS chứa 1.439.589 hình ảnh không có nhãn có nguồn gốc từ YFCC-100M.

Tất cả hình ảnh trong tập dữ liệu này đều được cấp phép theo giấy phép CC-BY, cũng như chính tập dữ liệu đó. Đối với YFCC-100M, hãy xem http://www.multimediacommons.org/

  • Tài liệu bổ sung : Khám phá trên giấy tờ có mã

  • Trang chủ : https://www.robots.ox.ac.uk/~vgg/data/pass/

  • Mã nguồn : tfds.datasets.pass.Builder

  • Phiên bản :

    • 1.0.0 : Bản phát hành đầu tiên.
    • 2.0.0 : v2: Đã xóa 472 hình ảnh khỏi v1 vì chúng chứa con người. Cũng đã thêm siêu dữ liệu: ngày tháng và GPS.
    • 3.0.0 (mặc định): v3: Đã xóa 131 hình ảnh khỏi v2 vì chúng chứa con người/hình xăm.
  • Kích thước tải xuống : 167.30 GiB

  • Kích thước tập dữ liệu : 166.43 GiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Chia tách :

Tách ra Ví dụ
'train' 1.439.588
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/creator_uname': Text(shape=(), dtype=string),
    'image/date_taken': Text(shape=(), dtype=string),
    'image/gps_lat': float32,
    'image/gps_lon': float32,
    'image/hash': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không, 3) uint8
hình ảnh/người sáng tạo_uname Chữ sợi dây
hình ảnh/ngày_taken Chữ sợi dây
hình ảnh/gps_lat Tenxơ phao32
hình ảnh/gps_lon Tenxơ phao32
hình ảnh/băm Chữ sợi dây

Hình dung

  • Trích dẫn :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}