curated_breast_imaging_ddsm

  • Описание :

CBIS-DDSM (подмножество DDSM, разработанное для визуализации молочной железы) представляет собой обновленную и стандартизированную версию цифровой базы данных для скрининговой маммографии (DDSM). DDSM представляет собой базу данных 2620 отсканированных пленочных маммографических исследований. Он содержит нормальные, доброкачественные и злокачественные случаи с проверенной информацией о патологии.

Конфигурация по умолчанию состоит из патчей, извлеченных из исходных маммограмм в соответствии с описанием ( http://arxiv.org/abs/1708.09427 ), чтобы сформулировать задачу, которую необходимо решить в традиционной настройке классификации изображений.

Поскольку для загрузки и чтения изображений, содержащихся в наборе данных, необходимы специальное программное обеспечение и библиотеки, TFDS предполагает, что пользователь загрузил исходные файлы DCIM и преобразовал их в PNG.

Следующие команды (или эквивалентные) следует использовать для создания файлов PNG, чтобы гарантировать воспроизводимые результаты:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs
-n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Полученные изображения следует поместить в manual_dir , например: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi
= {10.7937/k9/tcia.2016.7o02s9cy},
  url
= {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author
= {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title
= {Curated Breast Imaging Subset of DDSM},
  publisher
= {The Cancer Imaging Archive},
  year
= {2016},
}
@article{TCIA_Citation,
  author
= {
    K
. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P
. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L
. Tarbox and F. Prior
 
},
  title
= { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
 
Public Information Repository} },
  journal
= {Journal of Digital Imaging},
  volume
= {26},
  month
= {December},
  year
= {2013},
  pages
= {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    
= {Li Shen},
  title    
= {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               
An All Convolutional Design},
  journal  
= {CoRR},
  volume    
= {abs/1708.09427},
  year      
= {2017},
  url      
= {http://arxiv.org/abs/1708.09427},
  archivePrefix
= {arXiv},
  eprint    
= {1708.09427},
  timestamp
= {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    
= {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource
= {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (конфигурация по умолчанию)

  • Описание конфигурации : патчи, содержащие как случаи кальцификации, так и массовые образования, а также пути без отклонений. Разработан как традиционная задача классификации 5 классов.

  • Размер загрузки : 2.01 MiB

  • Размер набора данных : 801.46 MiB

  • Расколы :

Расколоть Примеры
'test' 9770
'train' 49 780
'validation' 5,580
  • Структура функции :
FeaturesDict({
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
идентификатор Текст нить
изображение Изображение (Нет, Нет, 1) uint8
этикетка Класслейбл int64

Визуализация

curated_breast_imaging_ddsm/original-calc

  • Описание конфигурации : Исходные изображения случаев кальцификации, сжатые в формате PNG без потерь.

  • Размер загрузки : 1.06 MiB

  • Размер набора данных : 4.42 GiB

  • Расколы :

Расколоть Примеры
'test' 284
'train' 1227
  • Структура функции :
FeaturesDict({
   
'abnormalities': Sequence({
       
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
       
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
       
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
       
'id': int32,
       
'mask': Image(shape=(None, None, 1), dtype=uint8),
       
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
       
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
   
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'patient': Text(shape=(), dtype=string),
   
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
аномалии Последовательность
отклонения/оценка Класслейбл int64
аномалии/calc_distribution Класслейбл int64
аномалии/calc_type Класслейбл int64
аномалии/идентификатор Тензор int32
аномалии/маска Изображение (Нет, Нет, 1) uint8
отклонения/патология Класслейбл int64
аномалии/тонкости Класслейбл int64
грудь Класслейбл int64
идентификатор Текст нить
изображение Изображение (Нет, Нет, 1) uint8
пациент Текст нить
вид Класслейбл int64

Визуализация

curated_breast_imaging_ddsm/original-mass

  • Описание конфига : Исходные изображения массовых случаев, сжатые в PNG без потерь.

  • Размер загрузки : 966.57 KiB

  • Размер набора данных : 4.80 GiB

  • Расколы :

Расколоть Примеры
'test' 348
'train' 1166
  • Структура функции :
FeaturesDict({
   
'abnormalities': Sequence({
       
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
       
'id': int32,
       
'mask': Image(shape=(None, None, 1), dtype=uint8),
       
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
       
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
       
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
       
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
   
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'patient': Text(shape=(), dtype=string),
   
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Функциональная документация :
Особенность Сорт Форма Дтип Описание
ВозможностиDict
аномалии Последовательность
отклонения/оценка Класслейбл int64
аномалии/идентификатор Тензор int32
аномалии/маска Изображение (Нет, Нет, 1) uint8
аномалии/массовые поля Класслейбл int64
аномалии/массовая_форма Класслейбл int64
отклонения/патология Класслейбл int64
аномалии/тонкости Класслейбл int64
грудь Класслейбл int64
идентификатор Текст нить
изображение Изображение (Нет, Нет, 1) uint8
пациент Текст нить
вид Класслейбл int64

Визуализация