- תיאור :
BCCD Dataset הוא מערך נתונים בקנה מידה קטן לזיהוי תאי דם.
תודה על הנתונים והביאורים המקוריים מ-cosmicad ו-akshaylamba. מערך הנתונים המקורי מאורגן מחדש לפורמט VOC. מערך הנתונים של BCCD הוא תחת רישיון MIT.
הכנת נתונים חשובה לשימוש למידת מכונה. בפרויקט זה נעשה שימוש באלגוריתם Faster R-CNN מ-keras-frcnn לזיהוי אובייקטים. מתוך מערך נתונים זה, nicolaschen1 פיתחה שני סקריפטים של Python כדי ליצור נתוני הכנה (קובץ CSV ותמונות) לזיהוי חריגות בתאי דם בתמונות רפואיות.
export.py: הוא יוצר את הקובץ "test.csv" עם כל הנתונים הדרושים: filename, class_name, x1,y1,x2,y2. plot.py: הוא משרטט את התיבות עבור כל תמונה ושומר אותה בספרייה חדשה.
סוג תמונה: jpeg(JPEG) רוחב x גובה: 640 x 480
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/Shenggan/BCCD_Dataset
קוד מקור :
tfds.datasets.bccd.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
7.51 MiB
גודל ערכת נתונים :
7.34 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 72 |
'train' | 205 |
'validation' | 87 |
- מבנה תכונה :
FeaturesDict({
'image': Image(shape=(480, 640, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
}),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תמונה | תמונה | (480, 640, 3) | uint8 | |
תמונה/שם קובץ | טֶקסט | חוּט | ||
חפצים | סדר פעולות | |||
אובייקטים/bbox | BBoxFeature | (4,) | לצוף32 | |
חפצים/תווית | ClassLabel | int64 |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ):
- דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@ONLINE {BCCD_Dataset,
author = "Shenggan",
title = "BCCD Dataset",
year = "2017",
url = "https://github.com/Shenggan/BCCD_Dataset"
}