- Opis :
Pobierz SA-1B
Segment Everything 1 Billion (SA-1B) to zbiór danych przeznaczony do uczenia modeli segmentacji obiektów ogólnego przeznaczenia na podstawie obrazów otwartego świata. Zbiór danych został wprowadzony w artykule „Segment Everything” .
Zbiór danych SA-1B składa się z 11 milionów różnorodnych obrazów o wysokiej rozdzielczości, licencjonowanych i chroniących prywatność oraz adnotacji w masce 1.1B. Maski są podawane w formacie kodowania długości serii COCO (RLE) i nie mają klas.
Licencja jest niestandardowa. Prosimy o zapoznanie się z pełnym regulaminem na stronie https://ai.facebook.com/datasets/segment-anything-downloads
Wszystkie funkcje znajdują się w oryginalnym zbiorze danych, z wyjątkiem image.content
(zawartość obrazu).
Możesz dekodować maski segmentacji za pomocą:
import tensorflow_datasets as tfds
pycocotools = tfds.core.lazy_imports.pycocotools
ds = tfds.load('segment_anything', split='train')
for example in tfds.as_numpy(ds):
segmentation = example['annotations']['segmentation']
for counts, size in zip(segmentation['counts'], segmentation['size']):
encoded_mask = {'size': size, 'counts': counts}
mask = pycocotools.decode(encoded_mask) # np.array(dtype=uint8) mask
...
Strona główna : https://ai.facebook.com/datasets/segment-anything-downloads
Kod źródłowy :
tfds.datasets.segment_anything.Builder
Wersje :
-
1.0.0
(domyślnie): Wersja pierwsza.
-
Rozmiar pobierania :
10.28 TiB
Rozmiar zbioru danych :
10.59 TiB
Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do
download_config.manual_dir
(domyślnie jest to~/tensorflow_datasets/downloads/manual/
):
Pobierz plik łączy z https://ai.facebook.com/datasets/segment-anything-downloadsmanual_dir
powinien zawierać plik łączy zapisany jako segment_anything_links.txt.Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'train' | 11 185 362 |
- Struktura funkcji :
FeaturesDict({
'annotations': Sequence({
'area': Scalar(shape=(), dtype=uint64, description=The area in pixels of the mask.),
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=The box around the mask, in TFDS format.),
'crop_box': BBoxFeature(shape=(4,), dtype=float32, description=The crop of the image used to generate the mask, in TFDS format.),
'id': Scalar(shape=(), dtype=uint64, description=Identifier for the annotation.),
'point_coords': Tensor(shape=(1, 2), dtype=float64, description=The point coordinates input to the model to generate the mask.),
'predicted_iou': Scalar(shape=(), dtype=float64, description=The model's own prediction of the mask's quality.),
'segmentation': FeaturesDict({
'counts': string,
'size': Tensor(shape=(2,), dtype=uint64),
}),
'stability_score': Scalar(shape=(), dtype=float64, description=A measure of the mask's quality.),
}),
'image': FeaturesDict({
'content': Image(shape=(None, None, 3), dtype=uint8, description=Content of the image.),
'file_name': string,
'height': uint64,
'image_id': uint64,
'width': uint64,
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
adnotacje | Sekwencja | |||
adnotacje/obszar | Skalarny | uint64 | Obszar maski w pikselach. | |
adnotacje/bbox | Funkcja BBox | (4,) | pływak32 | Pudełko wokół maski, w formacie TFDS. |
adnotacje/crop_box | Funkcja BBox | (4,) | pływak32 | Przycięcie obrazu użytego do wygenerowania maski w formacie TFDS. |
adnotacje/id | Skalarny | uint64 | Identyfikator adnotacji. | |
adnotacje/współrzędne_punktów | Napinacz | (1, 2) | pływak64 | Dane wejściowe współrzędnych punktu do modelu w celu wygenerowania maski. |
adnotacje/przewidywane_iou | Skalarny | pływak64 | Własne przewidywania modelki dotyczące jakości maski. | |
adnotacje/segmentacja | FunkcjeDykt | Zakodowana maska segmentacji w formacie COCO RLE (dykt z size i counts kluczy). | ||
adnotacje/segmentacja/zliczenia | Napinacz | smyczkowy | ||
adnotacje/segmentacja/rozmiar | Napinacz | (2,) | uint64 | |
adnotacje/wynik_stabilności | Skalarny | pływak64 | Miara jakości maski. | |
obraz | FunkcjeDykt | |||
obraz/treść | Obraz | (Brak, Brak, 3) | uint8 | Treść obrazu. |
obraz/nazwa_pliku | Napinacz | smyczkowy | ||
obraz/wysokość | Napinacz | uint64 | ||
obraz/identyfikator_obrazu | Napinacz | uint64 | ||
obraz/szerokość | Napinacz | uint64 |
Klucze nadzorowane (zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ): Brak.
Cytat :
@misc{kirillov2023segment,
title={Segment Anything},
author={Alexander Kirillov and Eric Mintun and Nikhila Ravi and Hanzi Mao and Chloe Rolland and Laura Gustafson and Tete Xiao and Spencer Whitehead and Alexander C. Berg and Wan-Yen Lo and Piotr Dollár and Ross Girshick},
year={2023},
eprint={2304.02643},
archivePrefix={arXiv},
primaryClass={cs.CV}
}