Visualização : Explorar em Conheça seus dados
Descrição :
PASS é um conjunto de dados de imagem em grande escala que não inclui nenhum ser humano, partes humanas ou outras informações de identificação pessoal. Ele pode ser usado para pré-treinamento auto-supervisionado de alta qualidade, reduzindo significativamente as preocupações com a privacidade.
PASS contém 1.439.589 imagens sem nenhum rótulo proveniente de YFCC-100M.
Todas as imagens neste conjunto de dados são licenciadas sob a licença CC-BY, assim como o próprio conjunto de dados. Para YFCC-100M, consulte http://www.multimediacommons.org/
Documentação Adicional : Explore em Papers With Code
Página inicial : https://www.robots.ox.ac.uk/~vgg/data/pass/
Código -fonte:
tfds.datasets.pass.Builder
Versões :
-
1.0.0
: versão inicial. -
2.0.0
: v2: Removidas 472 imagens da v1 porque continham seres humanos. Também foram adicionados metadados: dados coletados e GPS. -
3.0.0
(padrão): v3: Removidas 131 imagens da v2 porque continham humanos/tatuagens.
-
Tamanho do download :
167.30 GiB
Tamanho do conjunto de dados :
166.43 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 1.439.588 |
- Estrutura de recursos :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
imagem | Imagem | (Nenhuma, Nenhuma, 3) | uint8 | |
image/creator_uname | Texto | corda | ||
imagem/data_tirada | Texto | corda | ||
imagem/gps_lat | tensor | float32 | ||
image/gps_lon | tensor | float32 | ||
imagem/hash | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
- Citação :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}