Visualización : Explore en Know Your Data
Descripción :
PASS es un conjunto de datos de imágenes a gran escala que no incluye seres humanos, partes humanas u otra información de identificación personal. Se puede utilizar para una formación previa autosupervisada de alta calidad al tiempo que reduce significativamente los problemas de privacidad.
PASS contiene 1 439 589 imágenes sin etiquetas provenientes de YFCC-100M.
Todas las imágenes de este conjunto de datos tienen licencia CC-BY, al igual que el propio conjunto de datos. Para YFCC-100M, consulte http://www.multimediacommons.org/
Documentación adicional : Explore en Papers With Code
Página de inicio: https://www.robots.ox.ac.uk/~vgg/data/pass/
Código fuente :
tfds.datasets.pass.BuilderVersiones :
-
1.0.0: Versión inicial. -
2.0.0: v2: Se eliminaron 472 imágenes de v1 porque contenían humanos. También se agregaron metadatos: datetaken y GPS. -
3.0.0(predeterminado): v3: Se eliminaron 131 imágenes de v2 porque contenían humanos/tatuajes.
-
Tamaño de descarga :
167.30 GiBTamaño del conjunto de datos :
166.43 GiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 1,439,588 |
- Estructura de características :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| CaracterísticasDict | ||||
| imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
| imagen/creator_uname | Texto | cuerda | ||
| imagen/fecha_tomada | Texto | cuerda | ||
| imagen/gps_lat | Tensor | flotar32 | ||
| imagen/gps_lon | Tensor | flotar32 | ||
| imagen/hash | Texto | cuerda |
Claves supervisadas (Ver
as_superviseddoc ):NoneFigura ( tfds.show_examples ):

- Ejemplos ( tfds.as_dataframe ):
- Cita :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}