curated_breast_imaging_ddsm

  • Keterangan :

CBIS-DDSM (Curated Breast Imaging Subset of DDSM) adalah versi terbaru dan terstandarisasi dari Database Digital untuk Skrining Mammografi (DDSM). DDSM adalah database dari 2.620 studi film mamografi yang dipindai. Ini berisi kasus normal, jinak, dan ganas dengan informasi patologi terverifikasi.

Konfigurasi default dibuat dari tambalan yang diekstraksi dari mammogram asli, mengikuti deskripsi dari ( http://arxiv.org/abs/1708.09427 ), untuk membingkai tugas yang harus diselesaikan dalam pengaturan klasifikasi gambar tradisional.

Karena perangkat lunak dan pustaka khusus diperlukan untuk mengunduh dan membaca gambar yang terdapat dalam kumpulan data, TFDS berasumsi bahwa pengguna telah mengunduh file DCIM asli dan mengonversinya ke PNG.

Perintah berikut (atau yang setara) harus digunakan untuk menghasilkan file PNG, untuk menjamin hasil yang dapat direproduksi:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Gambar yang dihasilkan harus dimasukkan ke dalam manual_dir , seperti: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (konfigurasi default)

  • Deskripsi konfigurasi : Tambalan yang mengandung kalsifikasi dan kasus massa, ditambah jalur tanpa kelainan. Dirancang sebagai tugas klasifikasi 5 kelas tradisional.

  • Ukuran unduhan : 2.01 MiB

  • Ukuran kumpulan data : 801.46 MiB

  • Perpecahan :

Membelah Contoh
'test' 9.770
'train' 49.780
'validation' 5.580
  • Struktur fitur :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
pengenal Teks rangkaian
gambar Gambar (Tidak ada, Tidak ada, 1) uint8
label Label Kelas int64

Visualisasi

curated_breast_imaging_ddsm/original-calc

  • Deskripsi konfigurasi : Gambar asli kasus kalsifikasi yang dikompresi dalam PNG lossless.

  • Ukuran unduhan : 1.06 MiB

  • Ukuran kumpulan data : 4.42 GiB

  • Perpecahan :

Membelah Contoh
'test' 284
'train' 1.227
  • Struktur fitur :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
kelainan Urutan
kelainan/penilaian Label Kelas int64
kelainan/distribusi_kals Label Kelas int64
kelainan/tipe_kals Label Kelas int64
kelainan/identitas Tensor int32
kelainan/topeng Gambar (Tidak ada, Tidak ada, 1) uint8
kelainan/patologi Label Kelas int64
kelainan/kehalusan Label Kelas int64
dada Label Kelas int64
pengenal Teks rangkaian
gambar Gambar (Tidak ada, Tidak ada, 1) uint8
sabar Teks rangkaian
melihat Label Kelas int64

Visualisasi

curated_breast_imaging_ddsm/original-mass

  • Deskripsi konfigurasi : Gambar asli dari kasus massal yang dikompresi dalam PNG lossless.

  • Ukuran unduhan : 966.57 KiB

  • Ukuran kumpulan data : 4.80 GiB

  • Perpecahan :

Membelah Contoh
'test' 348
'train' 1.166
  • Struktur fitur :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
kelainan Urutan
kelainan/penilaian Label Kelas int64
kelainan/identitas Tensor int32
kelainan/topeng Gambar (Tidak ada, Tidak ada, 1) uint8
kelainan/margin_massa Label Kelas int64
kelainan/bentuk_massa Label Kelas int64
kelainan/patologi Label Kelas int64
kelainan/kehalusan Label Kelas int64
dada Label Kelas int64
pengenal Teks rangkaian
gambar Gambar (Tidak ada, Tidak ada, 1) uint8
sabar Teks rangkaian
melihat Label Kelas int64

Visualisasi