- Sự miêu tả :
CBIS-DDSM (Tập hợp con hình ảnh vú được giám sát của DDSM) là phiên bản cập nhật và tiêu chuẩn hóa của Cơ sở dữ liệu kỹ thuật số để sàng lọc chụp nhũ ảnh (DDSM). DDSM là cơ sở dữ liệu gồm 2.620 nghiên cứu chụp X-quang tuyến vú bằng phim quét. Nó chứa các trường hợp bình thường, lành tính và ác tính với thông tin bệnh lý đã được xác minh.
Cấu hình mặc định được tạo từ các bản vá được trích xuất từ ảnh chụp quang tuyến vú ban đầu, theo mô tả từ ( http://arxiv.org/abs/1708.09427 ), để đóng khung nhiệm vụ cần giải quyết trong cài đặt phân loại hình ảnh truyền thống.
Trang chủ : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
Mã nguồn :
tfds.image_classification.CuratedBreastImagingDDSM
Phiên bản :
-
2.0.1
: API phân chia mới ( https://tensorflow.org/datasets/splits ) -
3.0.0
(mặc định): Lấy mẫu cắt xén tốt hơn ( https://github.com/tensorflow/datasets/pull/2502 )
-
Hướng dẫn tải xuống thủ công : Tập dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào
download_config.manual_dir
(mặc định là~/tensorflow_datasets/downloads/manual/
):
Bạn có thể tải xuống hình ảnh từ https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
Vì cần có phần mềm và thư viện đặc biệt để tải xuống và đọc các hình ảnh có trong tập dữ liệu, TFDS giả định rằng người dùng đã tải xuống các tệp DCIM gốc và chuyển đổi chúng thành PNG.
Nên sử dụng các lệnh sau (hoặc tương đương) để tạo tệp PNG để đảm bảo kết quả có thể lặp lại:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
Hình ảnh kết quả phải được đặt trong manual_dir
, như: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Khóa được giám sát (Xem
as_supervised
doc ):None
Trích dẫn :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (cấu hình mặc định)
Mô tả cấu hình : Các bản vá chứa cả trường hợp vôi hóa và trường hợp khối, cộng với các đường dẫn không có bất thường. Được thiết kế như một nhiệm vụ phân loại 5 lớp truyền thống.
Kích thước tải xuống :
2.01 MiB
Kích thước tập dữ liệu :
801.46 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 9.770 |
'train' | 49.780 |
'validation' | 5.580 |
- Cấu trúc tính năng :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
nhận dạng | Chữ | sợi dây | ||
hình ảnh | Hình ảnh | (Không có, Không có, 1) | uint8 | |
nhãn | Nhãn lớp | int64 |
- Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/origin-calc
Mô tả cấu hình : Hình ảnh gốc của các trường hợp vôi hóa được nén ở định dạng PNG không mất dữ liệu.
Kích thước tải xuống :
1.06 MiB
Kích thước tập dữ liệu :
4.42 GiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 284 |
'train' | 1.227 |
- Cấu trúc tính năng :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
bất thường | Sự liên tiếp | |||
bất thường/đánh giá | Nhãn lớp | int64 | ||
bất thường/phân bổ canxi | Nhãn lớp | int64 | ||
bất thường/calc_type | Nhãn lớp | int64 | ||
bất thường/id | Tenxơ | int32 | ||
bất thường/mặt nạ | Hình ảnh | (Không có, Không có, 1) | uint8 | |
bất thường/bệnh lý | Nhãn lớp | int64 | ||
sự bất thường/tinh tế | Nhãn lớp | int64 | ||
nhũ hoa | Nhãn lớp | int64 | ||
nhận dạng | Chữ | sợi dây | ||
hình ảnh | Hình ảnh | (Không có, Không có, 1) | uint8 | |
kiên nhẫn | Chữ | sợi dây | ||
xem | Nhãn lớp | int64 |
- Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/bản gốc-mass
Mô tả cấu hình : Hình ảnh gốc của các case hàng loạt được nén ở định dạng PNG không mất dữ liệu.
Kích thước tải xuống :
966.57 KiB
Kích thước tập dữ liệu :
4.80 GiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 348 |
'train' | 1.166 |
- Cấu trúc tính năng :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
bất thường | Sự liên tiếp | |||
bất thường/đánh giá | Nhãn lớp | int64 | ||
bất thường/id | Tenxơ | int32 | ||
bất thường/mặt nạ | Hình ảnh | (Không có, Không có, 1) | uint8 | |
bất thường/khối_lợi | Nhãn lớp | int64 | ||
bất thường/khối lượng_hình dạng | Nhãn lớp | int64 | ||
bất thường/bệnh lý | Nhãn lớp | int64 | ||
sự bất thường/tinh vi | Nhãn lớp | int64 | ||
nhũ hoa | Nhãn lớp | int64 | ||
nhận dạng | Chữ | sợi dây | ||
hình ảnh | Hình ảnh | (Không có, Không có, 1) | uint8 | |
kiên nhẫn | Chữ | sợi dây | ||
xem | Nhãn lớp | int64 |
- Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):