- Opis :
Imagenet2012Subset jest podzbiorem oryginalnego zbioru danych ImageNet ILSVRC 2012. Zestaw danych ma ten sam zestaw walidacyjny, co oryginalny zestaw danych ImageNet ILSVRC 2012. Jednakże zbiór uczący jest podpróbkowany w sposób zrównoważony pod względem etykiet. W konfiguracji 1pct
, 1% lub 12811, próbkowane są obrazy, większość klas ma tę samą liczbę obrazów (średnio 12,8), niektóre klasy losowo mają o 1 przykład więcej niż inne; a w konfiguracji 10pct
, ~10% lub 128116, większość klas ma tę samą liczbę obrazów (średnio 128), a niektóre klasy losowo mają o 1 przykład więcej niż inne.
Ma to służyć jako punkt odniesienia dla uczenia się częściowo nadzorowanego i zostało pierwotnie wykorzystane w artykule SimCLR ( https://arxiv.org/abs/2002.05709 ).
Strona główna : http://image-net.org/
Kod źródłowy :
tfds.datasets.imagenet2012_subset.Builder
Wersje :
-
2.0.0
: Napraw etykiety sprawdzające. -
2.0.1
: Poprawka kodowania. Żadnych zmian z punktu widzenia użytkownika. 3.0.0
: Naprawiono kolorowanie na ~12 obrazach (CMYK -> RGB). Napraw format zapewniający spójność (przekonwertuj pojedynczy obraz PNG na Jpeg). Szybszy odczyt generacji bezpośrednio z archiwum.4.0.0
: (niepublikowane)5.0.0
(domyślnie): Nowe podzielone API ( https://tensorflow.org/datasets/splits )5.1.0
: Dodano podział testu.
-
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do
download_config.manual_dir
(domyślnie jest to~/tensorflow_datasets/downloads/manual/
):
katalog_ręczny powinien zawierać dwa pliki: ILSVRC2012_img_train.tar i ILSVRC2012_img_val.tar. Aby otrzymać link do pobrania zestawu danych, musisz zarejestrować się na stronie https://image-net.org/download-images .Automatyczne buforowanie ( dokumentacja ): Nie
Struktura funkcji :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
Nazwa pliku | Tekst | strunowy | ||
obraz | Obraz | (Brak, Brak, 3) | uint8 | |
etykieta | Etykieta klasy | int64 |
Klucze nadzorowane (zobacz dokument
as_supervised
):('image', 'label')
Cytat :
@article{chen2020simple,
title={A Simple Framework for Contrastive Learning of Visual Representations},
author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (konfiguracja domyślna)
Opis konfiguracji : 1% całkowitego zestawu szkoleniowego ImageNet.
Rozmiar pliku do pobrania :
254.22 KiB
Rozmiar zbioru danych :
7.61 GiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 12811 |
'validation' | 50 000 |
- Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
imagenet2012_subset/10pct
Opis konfiguracji : 10% całkowitego zestawu szkoleniowego ImageNet.
Rozmiar pliku do pobrania :
2.48 MiB
Rozmiar zbioru danych :
19.91 GiB
Podziały :
Podział | Przykłady |
---|---|
'train' | 128116 |
'validation' | 50 000 |
- Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):