- Opis :
PASS to wielkoskalowy zbiór danych obrazu, który nie zawiera żadnych ludzi, części ludzkich ani innych informacji umożliwiających identyfikację. Można go używać do wysokiej jakości samonadzorowanego szkolenia wstępnego, znacznie zmniejszając obawy dotyczące prywatności.
PASS zawiera 1 439 589 obrazów bez żadnych etykiet pochodzących z YFCC-100M.
Wszystkie obrazy w tym zbiorze danych są objęte licencją CC-BY, podobnie jak sam zbiór danych. Informacje na temat YFCC-100M można znaleźć na stronie http://www.multimediacommons.org/
Dodatkowa dokumentacja : Eksploruj w dokumentach z kodem
Strona główna : https://www.robots.ox.ac.uk/~vgg/data/pass/
Kod źródłowy :
tfds.datasets.pass.Builder
Wersje :
-
1.0.0
: Pierwsza wersja. -
2.0.0
: v2: Usunięto 472 obrazy z wersji 1, ponieważ przedstawiały ludzi. Dodano także metadane: datetake i GPS. -
3.0.0
(domyślnie): v3: Usunięto 131 obrazów z wersji 2, ponieważ zawierały ludzi/tatuaże.
-
Rozmiar pobierania :
167.30 GiB
Rozmiar zbioru danych :
166.43 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'train' | 1 439 588 |
- Struktura funkcji :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
obraz | Obraz | (Brak, Brak, 3) | uint8 | |
obraz/nazwa_twórcy | Tekst | strunowy | ||
zdjęcie/data_wykonania | Tekst | strunowy | ||
image/gps_lat | Napinacz | pływak32 | ||
image/gps_lon | Napinacz | pływak32 | ||
obraz/hasz | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
- Cytat :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}