segmen_apa saja

  • Keterangan :

Unduh SA-1B

Segment Anything 1 Billion (SA-1B) adalah kumpulan data yang dirancang untuk melatih model segmentasi objek tujuan umum dari gambar dunia terbuka. Kumpulan data diperkenalkan di makalah "Segmen Apa Pun" .

Kumpulan data SA-1B terdiri dari 11 juta gambar yang beragam, beresolusi tinggi, berlisensi, dan melindungi privasi serta 1,1 miliar anotasi masker. Masker diberikan dalam format COCO run-length coding (RLE), dan tidak memiliki kelas.

Lisensinya bersifat khusus. Silakan baca syarat dan ketentuan selengkapnya di https://ai.facebook.com/datasets/segment-anything-downloads

Semua fitur ada di dataset asli kecuali image.content (isi gambar).

Anda dapat memecahkan kode masker segmentasi dengan:

import tensorflow_datasets as tfds

pycocotools = tfds.core.lazy_imports.pycocotools

ds = tfds.load('segment_anything', split='train')
for example in tfds.as_numpy(ds):
  segmentation = example['annotations']['segmentation']
  for counts, size in zip(segmentation['counts'], segmentation['size']):
    encoded_mask = {'size': size, 'counts': counts}
    mask = pycocotools.decode(encoded_mask)  # np.array(dtype=uint8) mask
    ...
Membelah Contoh
'train' 11.185.362
  • Struktur fitur :
FeaturesDict({
    'annotations': Sequence({
        'area': Scalar(shape=(), dtype=uint64, description=The area in pixels of the mask.),
        'bbox': BBoxFeature(shape=(4,), dtype=float32, description=The box around the mask, in TFDS format.),
        'crop_box': BBoxFeature(shape=(4,), dtype=float32, description=The crop of the image used to generate the mask, in TFDS format.),
        'id': Scalar(shape=(), dtype=uint64, description=Identifier for the annotation.),
        'point_coords': Tensor(shape=(1, 2), dtype=float64, description=The point coordinates input to the model to generate the mask.),
        'predicted_iou': Scalar(shape=(), dtype=float64, description=The model's own prediction of the mask's quality.),
        'segmentation': FeaturesDict({
            'counts': string,
            'size': Tensor(shape=(2,), dtype=uint64),
        }),
        'stability_score': Scalar(shape=(), dtype=float64, description=A measure of the mask's quality.),
    }),
    'image': FeaturesDict({
        'content': Image(shape=(None, None, 3), dtype=uint8, description=Content of the image.),
        'file_name': string,
        'height': uint64,
        'image_id': uint64,
        'width': uint64,
    }),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
anotasi Urutan
anotasi/area Skalar uint64 Area dalam piksel topeng.
anotasi/bbox Fitur BBox (4,) float32 Kotak di sekeliling topeng, dalam format TFDS.
anotasi/crop_box Fitur BBox (4,) float32 Pemotongan gambar yang digunakan untuk menghasilkan topeng, dalam format TFDS.
anotasi/id Skalar uint64 Pengidentifikasi untuk anotasi.
anotasi/point_coords Tensor (1, 2) float64 Titik tersebut mengoordinasikan masukan ke model untuk menghasilkan topeng.
anotasi/prediksi_iou Skalar float64 Prediksi model sendiri terhadap kualitas masker.
anotasi/segmentasi FiturDict Masker segmentasi yang dikodekan dalam format COCO RLE (dikte dengan size dan counts kunci).
anotasi/segmentasi/hitungan Tensor rangkaian
anotasi/segmentasi/ukuran Tensor (2,) uint64
anotasi/stability_score Skalar float64 Ukuran kualitas masker.
gambar FiturDict
gambar/konten Gambar (Tidak ada, Tidak ada, 3) uint8 Isi gambar.
gambar/nama_file Tensor rangkaian
gambar/tinggi Tensor uint64
gambar/id_gambar Tensor uint64
gambar/lebar Tensor uint64
@misc{kirillov2023segment,
  title={Segment Anything},
  author={Alexander Kirillov and Eric Mintun and Nikhila Ravi and Hanzi Mao and Chloe Rolland and Laura Gustafson and Tete Xiao and Spencer Whitehead and Alexander C. Berg and Wan-Yen Lo and Piotr Dollár and Ross Girshick},
  year={2023},
  eprint={2304.02643},
  archivePrefix={arXiv},
  primaryClass={cs.CV}
}