lvis

  • وصف :

LVIS: مجموعة بيانات لتجزئة مثيلات المفردات الكبيرة.

  • وثائق إضافية : استكشف على Papers With Code

  • الصفحة الرئيسية : https://www.lvisdataset.org/

  • كود المصدر : tfds.datasets.lvis.Builder

  • الإصدارات :

    • 1.1.0 : تمت إضافة الحقول neg_category_ids و not_exhaustive_category_ids .
    • 1.2.0 : تمت إضافة أسماء الفئات.
    • 1.3.0 : تمت إضافة تقسيم الحد الأدنى.
    • 1.4.0 (افتراضي) : تمت إضافة أقنعة التجزئة إلى التقسيم الصغير.
  • حجم التنزيل : 25.38 GiB

  • حجم مجموعة البيانات : 23.06 GiB

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • انقسامات :

ينقسم أمثلة
'minival' 4,809
'test' 19,822
'train' 100,170
'validation' 19,809
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/id': int64,
    'neg_category_ids': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1203)),
    'not_exhaustive_category_ids': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1203)),
    'objects': Sequence({
        'area': int64,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'id': int64,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=1203),
        'segmentation': Image(shape=(None, None, 1), dtype=uint8),
    }),
})
  • توثيق الميزة :
ميزة فصل شكل نوع البيانات وصف
قاموس الميزات
صورة صورة (لا شيء، لا شيء، 3) uint8
الصورة/المعرف الموتر int64
معرفات الفئة السلبية التسلسل (ClassLabel) (لا أحد،) int64
معرفات الفئات غير الشاملة التسلسل (ClassLabel) (لا أحد،) int64
أشياء تسلسل
الأشياء/المنطقة الموتر int64
الكائنات/صندوق البريد ميزة BBox (4) تعويم 32
الكائنات/المعرف الموتر int64
الأشياء/التسمية تسمية الفئة int64
الأشياء/التجزئة صورة (لا شيء، لا شيء، 1) uint8

التصور

  • الاستشهاد :
@inproceedings{gupta2019lvis,
  title={ {LVIS}: A Dataset for Large Vocabulary Instance Segmentation},
  author={Gupta, Agrim and Dollar, Piotr and Girshick, Ross},
  booktitle={Proceedings of the {IEEE} Conference on Computer Vision and Pattern Recognition},
  year={2019}
}