- opis :
Imagenet2012Fewshot to podzbiór oryginalnego zbioru danych ImageNet ILSVRC 2012. Zestaw danych ma ten sam zestaw do sprawdzania poprawności, co oryginalny zestaw danych ImageNet ILSVRC 2012. Jednak zestaw treningowy jest podpróbkowany w zrównoważony sposób. W konfiguracji 5shot
zdjęć próbkowanych jest 5 obrazów na etykietę lub 5000 obrazów; aw konfiguracji 10shot
zdjęć próbkowanych jest 10 obrazów na etykietę lub 10000 obrazów.
Strona główna : http://image-net.org/
Kod źródłowy :
tfds.datasets.imagenet2012_fewshot.Builder
Wersje :
-
2.0.0
: Napraw etykiety sprawdzania poprawności. -
2.0.1
: Poprawka kodowania. Bez zmian z punktu widzenia użytkownika. 3.0.0
: Naprawiono kolorowanie na ~12 obrazach (CMYK -> RGB). Popraw format, aby uzyskać spójność (przekonwertuj pojedynczy obraz png na Jpeg). Szybsze generowanie odczytu bezpośrednio z archiwum.4.0.0
: (nieopublikowane)5.0.0
: Nowy podzielony interfejs API ( https://tensorflow.org/datasets/splits )5.0.1
(domyślnie): Brak informacji o wersji.5.1.0
: Dodano podział testu.
-
Rozmiar pliku do pobrania :
Unknown size
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do
download_config.manual_dir
(domyślnie~/tensorflow_datasets/downloads/manual/
):
manual_dir powinien zawierać dwa pliki: ILSVRC2012_img_train.tar i ILSVRC2012_img_val.tar. Musisz zarejestrować się na https://image-net.org/download-images , aby uzyskać link do pobrania zestawu danych.Automatyczne buforowanie ( dokumentacja ): Nie
Struktura funkcji :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
Nazwa pliku | Tekst | strunowy | ||
obraz | Obraz | (Brak, Brak, 3) | uint8 | |
etykieta | Etykieta klasy | int64 |
Klucze nadzorowane (zobacz dokument
as_supervised
):('image', 'label')
Cytat :
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_fewshot/1shot (domyślna konfiguracja)
Opis konfiguracji : 1 strzał z całego zestawu szkoleniowego ImageNet.
Rozmiar zestawu danych :
6.46 GiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1000 |
'tune' | 1000 |
'validation' | 50 000 |
- Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
imagenet2012_fewshot/5shot
Opis konfiguracji : 5 zdjęć całego zestawu szkoleniowego ImageNet.
Rozmiar zestawu danych :
6.88 GiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 5000 |
'tune' | 1000 |
'validation' | 50 000 |
- Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
imagenet2012_fewshot/10shot
Opis konfiguracji : 10 zdjęć z całego zestawu treningowego ImageNet.
Rozmiar zestawu danych :
7.42 GiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 10 000 |
'tune' | 1000 |
'validation' | 50 000 |
- Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):