bccd

  • תיאור :

BCCD Dataset הוא מערך נתונים בקנה מידה קטן לזיהוי תאי דם.

תודה על הנתונים והביאורים המקוריים מ-cosmicad ו-akshaylamba. מערך הנתונים המקורי מאורגן מחדש לפורמט VOC. מערך הנתונים של BCCD הוא תחת רישיון MIT.

הכנת נתונים חשובה לשימוש למידת מכונה. בפרויקט זה נעשה שימוש באלגוריתם Faster R-CNN מ-keras-frcnn לזיהוי אובייקטים. מתוך מערך נתונים זה, nicolaschen1 פיתחה שני סקריפטים של Python כדי ליצור נתוני הכנה (קובץ CSV ותמונות) לזיהוי חריגות בתאי דם בתמונות רפואיות.

export.py: הוא יוצר את הקובץ "test.csv" עם כל הנתונים הדרושים: filename, class_name, x1,y1,x2,y2. plot.py: הוא משרטט את התיבות עבור כל תמונה ושומר אותה בספרייה חדשה.

סוג תמונה: jpeg(JPEG) רוחב x גובה: 640 x 480

לְפַצֵל דוגמאות
'test' 72
'train' 205
'validation' 87
  • מבנה תכונה :
FeaturesDict({
    'image': Image(shape=(480, 640, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תמונה תמונה (480, 640, 3) uint8
תמונה/שם קובץ טֶקסט חוּט
חפצים סדר פעולות
אובייקטים/bbox BBoxFeature (4,) לצוף32
חפצים/תווית ClassLabel int64

רְאִיָה

  • ציטוט :
@ONLINE {BCCD_Dataset,
    author = "Shenggan",
    title  = "BCCD Dataset",
    year   = "2017",
    url    = "https://github.com/Shenggan/BCCD_Dataset"
}