التصور : استكشف في اعرف بياناتك
الوصف :
CBIS-DDSM (مجموعة فرعية من تصوير الثدي المنسق لـ DDSM) هي نسخة محدثة وموحدة من قاعدة البيانات الرقمية لفحص التصوير الشعاعي للثدي (DDSM). DDSM هي قاعدة بيانات تضم 2620 دراسة تصوير شعاعي للثدي تم مسحها ضوئيًا. يحتوي على حالات طبيعية وحميدة وخبيثة مع معلومات مرضية تم التحقق منها.
يتكون التكوين الافتراضي من رقع مستخرجة من صور الثدي الشعاعية الأصلية ، باتباع الوصف من ( http://arxiv.org/abs/1708.09427 ) ، من أجل تأطير المهمة لحلها في إعداد تصنيف تقليدي للصور.
الصفحة الرئيسية : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
كود المصدر :
tfds.image_classification.CuratedBreastImagingDDSM
إصدارات :
-
2.0.1
: تقسيم API الجديد ( https://tensorflow.org/datasets/splits ) -
3.0.0
(افتراضي): أخذ عينات محصول أفضل ( https://github.com/tensorflow/datasets/pull/2502 )
-
إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى
download_config.manual_dir
(الإعدادات الافتراضية على~/tensorflow_datasets/downloads/manual/
):
يمكنك تنزيل الصور من https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
نظرًا لضرورة وجود برامج ومكتبات خاصة لتنزيل الصور الموجودة في مجموعة البيانات وقراءتها ، تفترض TFDS أن المستخدم قد قام بتنزيل ملفات DCIM الأصلية وتحويلها إلى PNG.
يجب استخدام الأوامر التالية (أو ما يعادلها) لإنشاء ملفات PNG لضمان نتائج قابلة للتكرار:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
يجب وضع الصور الناتجة في manual_dir
، مثل: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
التخزين المؤقت التلقائي ( التوثيق ): لا
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الاقتباس :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm / patches (التكوين الافتراضي)
وصف التكوين : رقع تحتوي على كل من حالات التكلس والجماعية ، بالإضافة إلى المسارات الخالية من العيوب. تم تصميمه كمهمة تصنيف تقليدية من 5 فئات.
حجم التحميل :
2.01 MiB
حجم مجموعة البيانات :
801.46 MiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 9770 |
'train' | 49780 |
'validation' | 5،580 |
- هيكل الميزة :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
بطاقة تعريف | نص | خيط | ||
صورة | صورة | (لا شيء ، لا شيء ، 1) | uint8 | |
ملصق | ClassLabel | int64 |
- الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
curated_breast_imaging_ddsm / original-calc
وصف التكوين : الصور الأصلية لحالات التكلس مضغوطة في PNG بدون فقدان بيانات.
حجم التحميل :
1.06 MiB
حجم مجموعة البيانات :
4.42 GiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 284 |
'train' | 1،227 |
- هيكل الميزة :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
شذوذ | تسلسل | |||
الشذوذ / التقييم | ClassLabel | int64 | ||
الشذوذ / calc_distribution | ClassLabel | int64 | ||
شذوذ / نوع الكالس | ClassLabel | int64 | ||
شذوذ / معرف | موتر | int32 | ||
تشوهات / قناع | صورة | (لا شيء ، لا شيء ، 1) | uint8 | |
تشوهات / علم الأمراض | ClassLabel | int64 | ||
شذوذ / دقة | ClassLabel | int64 | ||
صدر | ClassLabel | int64 | ||
بطاقة تعريف | نص | خيط | ||
صورة | صورة | (لا شيء ، لا شيء ، 1) | uint8 | |
مريض | نص | خيط | ||
منظر | ClassLabel | int64 |
- الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
curated_breast_imaging_ddsm / original-mass
وصف التكوين : الصور الأصلية للحالات الضخمة مضغوطة في PNG بدون فقدان بيانات.
حجم التحميل :
966.57 KiB
حجم مجموعة البيانات :
4.80 GiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'test' | 348 |
'train' | 1166 |
- هيكل الميزة :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
شذوذ | تسلسل | |||
الشذوذ / التقييم | ClassLabel | int64 | ||
شذوذ / معرف | موتر | int32 | ||
تشوهات / قناع | صورة | (لا شيء ، لا شيء ، 1) | uint8 | |
الشذوذ / الهوامش الجماعية | ClassLabel | int64 | ||
شذوذ / شكل كتلة | ClassLabel | int64 | ||
تشوهات / علم الأمراض | ClassLabel | int64 | ||
شذوذ / دقة | ClassLabel | int64 | ||
صدر | ClassLabel | int64 | ||
بطاقة تعريف | نص | خيط | ||
صورة | صورة | (لا شيء ، لا شيء ، 1) | uint8 | |
مريض | نص | خيط | ||
منظر | ClassLabel | int64 |
- الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):