- Keterangan :
CBIS-DDSM (Curated Breast Imaging Subset of DDSM) adalah versi terbaru dan terstandarisasi dari Database Digital untuk Skrining Mammografi (DDSM). DDSM adalah database dari 2.620 studi film mamografi yang dipindai. Ini berisi kasus normal, jinak, dan ganas dengan informasi patologi terverifikasi.
Konfigurasi default dibuat dari tambalan yang diekstraksi dari mammogram asli, mengikuti deskripsi dari ( http://arxiv.org/abs/1708.09427 ), untuk membingkai tugas yang harus diselesaikan dalam pengaturan klasifikasi gambar tradisional.
Beranda : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
Kode sumber :
tfds.image_classification.CuratedBreastImagingDDSM
Versi :
-
2.0.1
: API terpisah baru ( https://tensorflow.org/datasets/splits ) -
3.0.0
(default): Pengambilan sampel pemangkasan yang lebih baik ( https://github.com/tensorflow/datasets/pull/2502 )
-
Petunjuk pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke
download_config.manual_dir
(default pada~/tensorflow_datasets/downloads/manual/
):
Anda dapat mengunduh gambar dari https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
Karena perangkat lunak dan pustaka khusus diperlukan untuk mengunduh dan membaca gambar yang terdapat dalam kumpulan data, TFDS berasumsi bahwa pengguna telah mengunduh file DCIM asli dan mengonversinya ke PNG.
Perintah berikut (atau yang setara) harus digunakan untuk menghasilkan file PNG, untuk menjamin hasil yang dapat direproduksi:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
Gambar yang dihasilkan harus dimasukkan ke dalam manual_dir
, seperti: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
Cache otomatis ( dokumentasi ): Tidak
Kunci yang diawasi (Lihat dokumen
as_supervised
):None
Kutipan :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (konfigurasi default)
Deskripsi konfigurasi : Tambalan yang mengandung kalsifikasi dan kasus massa, ditambah jalur tanpa kelainan. Dirancang sebagai tugas klasifikasi 5 kelas tradisional.
Ukuran unduhan :
2.01 MiB
Ukuran kumpulan data :
801.46 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 9.770 |
'train' | 49.780 |
'validation' | 5.580 |
- Struktur fitur :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
pengenal | Teks | rangkaian | ||
gambar | Gambar | (Tidak ada, Tidak ada, 1) | uint8 | |
label | Label Kelas | int64 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
Deskripsi konfigurasi : Gambar asli kasus kalsifikasi yang dikompresi dalam PNG lossless.
Ukuran unduhan :
1.06 MiB
Ukuran kumpulan data :
4.42 GiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 284 |
'train' | 1.227 |
- Struktur fitur :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
kelainan | Urutan | |||
kelainan/penilaian | Label Kelas | int64 | ||
kelainan/distribusi_kals | Label Kelas | int64 | ||
kelainan/tipe_kals | Label Kelas | int64 | ||
kelainan/identitas | Tensor | int32 | ||
kelainan/topeng | Gambar | (Tidak ada, Tidak ada, 1) | uint8 | |
kelainan/patologi | Label Kelas | int64 | ||
kelainan/kehalusan | Label Kelas | int64 | ||
dada | Label Kelas | int64 | ||
pengenal | Teks | rangkaian | ||
gambar | Gambar | (Tidak ada, Tidak ada, 1) | uint8 | |
sabar | Teks | rangkaian | ||
melihat | Label Kelas | int64 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-mass
Deskripsi konfigurasi : Gambar asli dari kasus massal yang dikompresi dalam PNG lossless.
Ukuran unduhan :
966.57 KiB
Ukuran kumpulan data :
4.80 GiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 348 |
'train' | 1.166 |
- Struktur fitur :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
kelainan | Urutan | |||
kelainan/penilaian | Label Kelas | int64 | ||
kelainan/identitas | Tensor | int32 | ||
kelainan/topeng | Gambar | (Tidak ada, Tidak ada, 1) | uint8 | |
kelainan/margin_massa | Label Kelas | int64 | ||
kelainan/bentuk_massa | Label Kelas | int64 | ||
kelainan/patologi | Label Kelas | int64 | ||
kelainan/kehalusan | Label Kelas | int64 | ||
dada | Label Kelas | int64 | ||
pengenal | Teks | rangkaian | ||
gambar | Gambar | (Tidak ada, Tidak ada, 1) | uint8 | |
sabar | Teks | rangkaian | ||
melihat | Label Kelas | int64 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):