bccd

  • Описание :

BCCD Dataset — это небольшой набор данных для обнаружения клеток крови.

Спасибо за исходные данные и аннотации от cosmicad и akshaylamba. Исходный набор данных реорганизован в формат VOC. Набор данных BCCD находится под лицензией MIT.

Подготовка данных важна для использования машинного обучения. В этом проекте используется алгоритм Faster R-CNN от keras-frcnn для обнаружения объектов. На основе этого набора данных nicolaschen1 разработал два скрипта Python для подготовки данных (CSV-файл и изображения) для распознавания аномалий клеток крови на медицинских изображениях.

export.py: он создает файл "test.csv" со всеми необходимыми данными: имя файла, имя_класса, x1,y1,x2,y2. plot.py: он рисует прямоугольники для каждого изображения и сохраняет их в новом каталоге.

Тип изображения: jpeg (JPEG) Ширина x Высота: 640 x 480

Расколоть Примеры
'test' 72
'train' 205
'validation' 87
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(480, 640, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    }),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (480, 640, 3) uint8
изображение/имя файла Текст нить
объекты Последовательность
объекты/bbox BBoxFeature (4,) поплавок32
объекты/метка Метка класса int64

Визуализация

  • Цитата :
@ONLINE {BCCD_Dataset,
    author = "Shenggan",
    title  = "BCCD Dataset",
    year   = "2017",
    url    = "https://github.com/Shenggan/BCCD_Dataset"
}