oxford_iiit_pet

  • Opis :

Zbiór danych zwierząt domowych Oxford-IIIT to zbiór danych dotyczący zdjęć zwierząt domowych składający się z 37 kategorii i obejmujący około 200 zdjęć dla każdej klasy. Obrazy mają duże różnice w skali, pozach i oświetleniu. Wszystkie obrazy mają powiązaną adnotację dotyczącą rasy i gatunku. Dodatkowo dostępne są ramki ograniczające nagłówek dla podziału szkoleniowego, co pozwala na wykorzystanie tego zbioru danych do prostych zadań wykrywania obiektów. W podziale testowym ramki ograniczające są puste.

Podział Przykłady
'test' 3669
'train' 3680
  • Struktura funkcji :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
nazwa_pliku Tekst smyczkowy
head_bbox Funkcja BBox (4,) pływak32
obraz Obraz (Brak, Brak, 3) uint8
etykieta Etykieta klasy int64
maska_segmentacji Obraz (Brak, Brak, 1) uint8
gatunek Etykieta klasy int64
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}