curated_breast_imaging_ddsm

  • وصف :

تعد CBIS-DDSM (المجموعة الفرعية لتصوير الثدي المنسق لـ DDSM) نسخة محدثة وموحدة من قاعدة البيانات الرقمية لفحص التصوير الشعاعي للثدي (DDSM). DDSM عبارة عن قاعدة بيانات تضم 2620 دراسة لتصوير الثدي بالأشعة السينية الممسوحة ضوئيًا. أنه يحتوي على الحالات الطبيعية والحميدة والخبيثة مع معلومات مرضية مؤكدة.

يتكون التكوين الافتراضي من تصحيحات مستخرجة من صور الثدي الشعاعية الأصلية، باتباع الوصف الموجود في ( http://arxiv.org/abs/1708.09427 )، من أجل تحديد إطار المهمة لحلها في إعداد تصنيف الصور التقليدي.

ونظرًا للحاجة إلى برامج ومكتبات خاصة لتنزيل الصور الموجودة في مجموعة البيانات وقراءتها، يفترض TFDS أن المستخدم قام بتنزيل ملفات DCIM الأصلية وتحويلها إلى PNG.

ينبغي استخدام الأوامر التالية (أو ما يعادلها) لإنشاء ملفات PNG، لضمان نتائج قابلة للتكرار:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

يجب وضع الصور الناتجة في manual_dir ، مثل: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

  • التخزين المؤقت التلقائي ( الوثائق ): لا

  • المفاتيح الخاضعة للإشراف (راجع as_supervised doc ): None

  • الاقتباس :

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (التكوين الافتراضي)

  • وصف التكوين : تصحيحات تحتوي على حالات التكلس والحالات الجماعية، بالإضافة إلى مسارات خالية من أي شذوذ. تم تصميمه كمهمة تصنيف تقليدية من 5 فئات.

  • حجم التحميل : 2.01 MiB

  • حجم مجموعة البيانات : 801.46 MiB

  • الإنشقاقات :

ينقسم أمثلة
'test' 9,770
'train' 49,780
'validation' 5,580
  • هيكل الميزة :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
بطاقة تعريف نص خيط
صورة صورة (لا شيء، لا شيء، 1) uint8
ملصق ClassLabel int64

التصور

curated_breast_imaging_ddsm/original-calc

  • وصف التكوين : الصور الأصلية لحالات التكلس مضغوطة بصيغة PNG بدون فقدان البيانات.

  • حجم التحميل : 1.06 MiB

  • حجم مجموعة البيانات : 4.42 GiB

  • الإنشقاقات :

ينقسم أمثلة
'test' 284
'train' 1,227
  • هيكل الميزة :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
تشوهات تسلسل
شذوذات / التقييم ClassLabel int64
شذوذات/calc_distribution ClassLabel int64
شذوذات/calc_type ClassLabel int64
شذوذات/معرف الموتر int32
شذوذات / قناع صورة (لا شيء، لا شيء، 1) uint8
التشوهات / علم الأمراض ClassLabel int64
شذوذات / دقة ClassLabel int64
صدر ClassLabel int64
بطاقة تعريف نص خيط
صورة صورة (لا شيء، لا شيء، 1) uint8
مريض نص خيط
منظر ClassLabel int64

التصور

curated_breast_imaging_ddsm/original-mass

  • وصف التكوين : الصور الأصلية للحالات الجماعية مضغوطة بتنسيق PNG بدون فقدان البيانات.

  • حجم التحميل : 966.57 KiB

  • حجم مجموعة البيانات : 4.80 GiB

  • الإنشقاقات :

ينقسم أمثلة
'test' 348
'train' 1,166
  • هيكل الميزة :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
تشوهات تسلسل
شذوذات / التقييم ClassLabel int64
شذوذات/معرف الموتر int32
شذوذات / قناع صورة (لا شيء، لا شيء، 1) uint8
شذوذات/mass_margins ClassLabel int64
شذوذات/mass_shape ClassLabel int64
التشوهات / علم الأمراض ClassLabel int64
شذوذات / دقة ClassLabel int64
صدر ClassLabel int64
بطاقة تعريف نص خيط
صورة صورة (لا شيء، لا شيء، 1) uint8
مريض نص خيط
منظر ClassLabel int64

التصور