- شرح :
CBIS-DDSM (زیر مجموعه تصویربرداری سینه انتخاب شده DDSM) نسخه به روز شده و استاندارد شده پایگاه داده دیجیتال برای غربالگری ماموگرافی (DDSM) است. DDSM یک پایگاه داده از 2620 مطالعه ماموگرافی فیلم اسکن شده است. این شامل موارد طبیعی، خوش خیم و بدخیم با اطلاعات پاتولوژی تایید شده است.
پیکربندی پیشفرض از تکههایی ساخته شده است که از ماموگرافیهای اصلی استخراج شدهاند، به دنبال شرح ( http://arxiv.org/abs/1708.09427 )، به منظور قاببندی کار برای حل در یک تنظیم طبقهبندی تصویر سنتی.
صفحه اصلی : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
کد منبع :
tfds.image_classification.CuratedBreastImagingDDSM
نسخه ها :
-
2.0.1
: API تقسیم جدید ( https://tensorflow.org/datasets/splits ) -
3.0.0
(پیشفرض): نمونه برداری بهتر ( https://github.com/tensorflow/datasets/pull/2502 )
-
دستورالعملهای دانلود دستی : این مجموعه داده از شما میخواهد که دادههای منبع را به صورت دستی در
download_config.manual_dir
دانلود کنید (پیشفرض~/tensorflow_datasets/downloads/manual/
):
می توانید تصاویر را از https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM دانلود کنید
از آنجایی که برای دانلود و خواندن تصاویر موجود در مجموعه داده به نرم افزار و کتابخانه های خاصی نیاز است، TFDS فرض می کند که کاربر فایل های اصلی DCIM را دانلود کرده و آنها را به PNG تبدیل کرده است.
دستورات زیر (یا معادل آن) باید برای تولید فایلهای PNG استفاده شوند تا نتایج قابل تکرار را تضمین کنند:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
تصاویر حاصل باید در manual_dir
قرار داده شوند، مانند: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
ذخیره خودکار ( اسناد ): خیر
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
نقل قول :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (پیکربندی پیشفرض)
توضیحات پیکربندی : وصلههایی که حاوی موارد کلسیفیکاسیون و جرم هستند، به علاوه مسیرهایی بدون ناهنجاری. به عنوان یک کار طبقه بندی 5 کلاسه سنتی طراحی شده است.
حجم دانلود :
2.01 MiB
حجم مجموعه داده :
801.46 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 9770 |
'train' | 49780 |
'validation' | 5,580 |
- ساختار ویژگی :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
شناسه | متن | رشته | ||
تصویر | تصویر | (هیچ، هیچ، 1) | uint8 | |
برچسب | ClassLabel | int64 |
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
توضیحات پیکربندی : تصاویر اصلی از موارد کلسیفیکاسیون فشرده شده در PNG بدون اتلاف.
حجم دانلود :
1.06 MiB
حجم مجموعه داده :
4.42 GiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 284 |
'train' | 1,227 |
- ساختار ویژگی :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
ناهنجاری ها | توالی | |||
ناهنجاری ها/ارزیابی | ClassLabel | int64 | ||
ناهنجاری ها / توزیع_کالک | ClassLabel | int64 | ||
ناهنجاری/نوع کالک | ClassLabel | int64 | ||
ناهنجاری ها / شناسه | تانسور | int32 | ||
ناهنجاری / ماسک | تصویر | (هیچ، هیچ، 1) | uint8 | |
ناهنجاری ها / آسیب شناسی | ClassLabel | int64 | ||
ناهنجاری/ظرافت | ClassLabel | int64 | ||
پستان | ClassLabel | int64 | ||
شناسه | متن | رشته | ||
تصویر | تصویر | (هیچ، هیچ، 1) | uint8 | |
صبور | متن | رشته | ||
چشم انداز | ClassLabel | int64 |
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-mass
توضیحات پیکربندی : تصاویر اصلی از کیس های انبوه فشرده شده در PNG بدون اتلاف.
حجم دانلود :
966.57 KiB
حجم مجموعه داده :
4.80 GiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 348 |
'train' | 1,166 |
- ساختار ویژگی :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
ناهنجاری ها | توالی | |||
ناهنجاری ها/ارزیابی | ClassLabel | int64 | ||
ناهنجاری / شناسه | تانسور | int32 | ||
ناهنجاری / ماسک | تصویر | (هیچ، هیچ، 1) | uint8 | |
ناهنجاری/حاشیه_انبوه | ClassLabel | int64 | ||
ناهنجاری/شکل_ جرمی | ClassLabel | int64 | ||
ناهنجاری ها / آسیب شناسی | ClassLabel | int64 | ||
ناهنجاری/ظرافت | ClassLabel | int64 | ||
پستان | ClassLabel | int64 | ||
شناسه | متن | رشته | ||
تصویر | تصویر | (هیچ، هیچ، 1) | uint8 | |
صبور | متن | رشته | ||
چشم انداز | ClassLabel | int64 |
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):