curated_breast_imaging_ddsm, curated_breast_imaging_ddsm

Il CBIS-DDSM (Curated Breast Imaging Subset of DDSM) è una versione aggiornata e standardizzata del Digital Database for Screening Mammography (DDSM). Il DDSM è un database di 2.620 studi di mammografia su pellicola scansionata. Contiene casi normali, benigni e maligni con informazioni patologiche verificate.

La configurazione predefinita è costituita da patch estratte dalle mammografie originali, seguendo la descrizione da ( http://arxiv.org/abs/1708.09427 ), al fine di inquadrare il compito da risolvere in un'impostazione di classificazione delle immagini tradizionale.

Poiché sono necessari software e librerie speciali per scaricare e leggere le immagini contenute nel set di dati, TFDS presuppone che l'utente abbia scaricato i file DCIM originali e li abbia convertiti in PNG.

I seguenti comandi (o equivalenti) devono essere utilizzati per generare i file PNG, al fine di garantire risultati riproducibili:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Le immagini risultanti dovrebbero essere inserite in manual_dir , come: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (configurazione predefinita)

  • Descrizione della configurazione : patch contenenti sia casi di calsificazione che di massa, oltre a percorsi senza anomalie. Progettato come un tradizionale compito di classificazione a 5 classi.

  • Dimensione del download : 2.01 MiB

  • Dimensione del set di dati : 801.46 MiB

  • Divisioni :

Diviso Esempi
'test' 9.770
'train' 49.780
'validation' 5.580
  • Struttura delle caratteristiche :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
id Testo corda
Immagine Immagine (Nessuno, Nessuno, 1) uint8
etichetta ClassLabel int64

Visualizzazione

curated_breast_imaging_ddsm/original-calc

  • Descrizione della configurazione : immagini originali dei casi di calcificazione compresse in PNG senza perdita.

  • Dimensione del download : 1.06 MiB

  • Dimensione del set di dati : 4.42 GiB

  • Divisioni :

Diviso Esempi
'test' 284
'train' 1.227
  • Struttura delle caratteristiche :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
anomalie Sequenza
anomalie/valutazione ClassLabel int64
anomalie/distribuzione_calc ClassLabel int64
anomalie/calc_type ClassLabel int64
anomalie/identificazione Tensore int32
anomalie/maschera Immagine (Nessuno, Nessuno, 1) uint8
anomalie/patologia ClassLabel int64
anomalie/sottigliezza ClassLabel int64
seno ClassLabel int64
id Testo corda
Immagine Immagine (Nessuno, Nessuno, 1) uint8
paziente Testo corda
visualizzazione ClassLabel int64

Visualizzazione

curated_breast_imaging_ddsm/original-mass

  • Descrizione della configurazione : immagini originali dei casi di massa compresse in PNG senza perdita di dati.

  • Dimensione del download : 966.57 KiB

  • Dimensione del set di dati : 4.80 GiB

  • Divisioni :

Diviso Esempi
'test' 348
'train' 1.166
  • Struttura delle caratteristiche :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
anomalie Sequenza
anomalie/valutazione ClassLabel int64
anomalie/identificazione Tensore int32
anomalie/maschera Immagine (Nessuno, Nessuno, 1) uint8
anomalie/margini_di_massa ClassLabel int64
anomalie/mass_shape ClassLabel int64
anomalie/patologia ClassLabel int64
anomalie/sottigliezza ClassLabel int64
seno ClassLabel int64
id Testo corda
Immagine Immagine (Nessuno, Nessuno, 1) uint8
paziente Testo corda
visualizzazione ClassLabel int64

Visualizzazione