시각화 : Know Your Data에서 탐색
설명 :
CBIS-DDSM(Curated Breast Imaging Subset of DDSM)은 DDSM(Digital Database for Screening Mammography)의 업데이트되고 표준화된 버전입니다. DDSM은 2,620개의 스캔된 필름 유방조영술 연구 데이터베이스입니다. 검증된 병리 정보와 함께 정상, 양성 및 악성 사례를 포함합니다.
기본 구성은 ( http://arxiv.org/abs/1708.09427 )의 설명에 따라 원본 유방조영술에서 추출한 패치로 구성되어 기존 이미지 분류 설정에서 해결할 작업을 구성합니다.
홈페이지 : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
버전 :
-
2.0.1
: 새로운 분할 API( https://tensorflow.org/datasets/splits ) -
3.0.0
(기본값): 자르기 샘플링 개선( https://github.com/tensorflow/datasets/pull/2502 )
-
수동 다운로드 지침 : 이 데이터 세트는 원본 데이터를
download_config.manual_dir
에 수동으로 다운로드해야 합니다(기본값은~/tensorflow_datasets/downloads/manual/
).
https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM 에서 이미지를 다운로드할 수 있습니다.
데이터 세트에 포함된 이미지를 다운로드하고 읽으려면 특수 소프트웨어와 라이브러리가 필요하기 때문에 TFDS는 사용자가 원본 DCIM 파일을 다운로드하고 이를 PNG로 변환했다고 가정합니다.
재현 가능한 결과를 보장하려면 다음 명령(또는 이에 상응하는 명령)을 사용하여 PNG 파일을 생성해야 합니다.
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
결과 이미지는 <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
와 같이 manual_dir
에 넣어야 합니다.
자동 캐시 ( 문서 ): 아니요
감독된 키 (
as_supervised
문서 참조):None
인용 :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches(기본 구성)
구성 설명 : 석회화 및 질량 사례를 모두 포함하는 패치와 이상이 없는 경로. 기존의 5등급 분류 작업으로 설계되었습니다.
다운로드 크기 :
2.01 MiB
데이터 세트 크기 :
801.46 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 9,770 |
'train' | 49,780 |
'validation' | 5,580 |
- 기능 구조 :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
ID | 텍스트 | 끈 | ||
영상 | 영상 | (없음, 없음, 1) | uint8 | |
상표 | 클래스 레이블 | int64 |
- 그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
구성 설명 : 무손실 PNG로 압축된 석회화 사례의 원본 이미지입니다.
다운로드 크기 :
1.06 MiB
데이터세트 크기 :
4.42 GiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 284 |
'train' | 1,227 |
- 기능 구조 :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
이상 | 순서 | |||
이상/평가 | 클래스 레이블 | int64 | ||
이상/calc_distribution | 클래스 레이블 | int64 | ||
이상/calc_type | 클래스 레이블 | int64 | ||
이상 현상/이드 | 텐서 | int32 | ||
이상 현상/마스크 | 영상 | (없음, 없음, 1) | uint8 | |
이상/병리 | 클래스 레이블 | int64 | ||
이상/미묘 | 클래스 레이블 | int64 | ||
가슴 | 클래스 레이블 | int64 | ||
ID | 텍스트 | 끈 | ||
영상 | 영상 | (없음, 없음, 1) | uint8 | |
인내심 있는 | 텍스트 | 끈 | ||
보다 | 클래스 레이블 | int64 |
- 그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-mass
구성 설명 : 무손실 PNG로 압축된 대량 사례의 원본 이미지.
다운로드 크기 :
966.57 KiB
데이터세트 크기 :
4.80 GiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 348 |
'train' | 1,166 |
- 기능 구조 :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
이상 | 순서 | |||
이상/평가 | 클래스 레이블 | int64 | ||
이상 현상/이드 | 텐서 | int32 | ||
이상 현상/마스크 | 영상 | (없음, 없음, 1) | uint8 | |
이상/mass_margins | 클래스 레이블 | int64 | ||
이상/mass_shape | 클래스 레이블 | int64 | ||
이상/병리 | 클래스 레이블 | int64 | ||
이상/미묘 | 클래스 레이블 | int64 | ||
가슴 | 클래스 레이블 | int64 | ||
ID | 텍스트 | 끈 | ||
영상 | 영상 | (없음, 없음, 1) | uint8 | |
인내심 있는 | 텍스트 | 끈 | ||
보다 | 클래스 레이블 | int64 |
- 그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):