Trực quan hóa : Khám phá khi biết dữ liệu của bạn
Mô tả :
PASS là tập dữ liệu hình ảnh quy mô lớn không bao gồm bất kỳ con người, bộ phận cơ thể người hoặc thông tin nhận dạng cá nhân nào khác. Nó có thể được sử dụng để đào tạo trước tự giám sát chất lượng cao đồng thời giảm đáng kể các lo ngại về quyền riêng tư.
PASS chứa 1.439.589 hình ảnh không có bất kỳ nhãn nào có nguồn gốc từ YFCC-100M.
Tất cả hình ảnh trong tập dữ liệu này đều được cấp phép theo giấy phép CC-BY, cũng như bản thân tập dữ liệu. Đối với YFCC-100M, hãy xem http://www.multidiacommons.org/
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://www.robots.ox.ac.uk/~vgg/data/pass/
Mã nguồn :
tfds.datasets.pass.Builder
Phiên bản :
-
1.0.0
: Bản phát hành đầu tiên. -
2.0.0
: v2: Đã xóa 472 hình ảnh khỏi v1 vì chúng chứa con người. Cũng đã thêm siêu dữ liệu: ngày tháng và GPS. -
3.0.0
(mặc định): v3: Đã xóa 131 hình ảnh khỏi v2 vì chúng chứa hình người/hình xăm.
-
Kích thước tải xuống :
167.30 GiB
Kích thước tập dữ liệu :
166.43 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 1.439.588 |
- Cấu trúc tính năng :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
hình ảnh | Hình ảnh | (Không, Không có, 3) | uint8 | |
image/creator_uname | Chữ | sợi dây | ||
ảnh/ngày_chụp | Chữ | sợi dây | ||
hình ảnh/gps_lat | tenxơ | phao32 | ||
hình ảnh/gps_lon | tenxơ | phao32 | ||
hình ảnh/băm | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}