curated_breast_imaging_ddsm ، curated_breast_imaging_ddsm

CBIS-DDSM (مجموعة فرعية من تصوير الثدي المنسق لـ DDSM) هي نسخة محدثة وموحدة من قاعدة البيانات الرقمية لفحص التصوير الشعاعي للثدي (DDSM). DDSM هي قاعدة بيانات تضم 2620 دراسة تصوير شعاعي للثدي تم مسحها ضوئيًا. يحتوي على حالات طبيعية وحميدة وخبيثة مع معلومات مرضية تم التحقق منها.

يتكون التكوين الافتراضي من رقع مستخرجة من صور الثدي الشعاعية الأصلية ، باتباع الوصف من ( http://arxiv.org/abs/1708.09427 ) ، من أجل تأطير المهمة لحلها في إعداد تصنيف تقليدي للصور.

نظرًا لضرورة وجود برامج ومكتبات خاصة لتنزيل الصور الموجودة في مجموعة البيانات وقراءتها ، تفترض TFDS أن المستخدم قد قام بتنزيل ملفات DCIM الأصلية وتحويلها إلى PNG.

يجب استخدام الأوامر التالية (أو ما يعادلها) لإنشاء ملفات PNG لضمان نتائج قابلة للتكرار:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

يجب وضع الصور الناتجة في manual_dir ، مثل: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm / patches (التكوين الافتراضي)

  • وصف التكوين : رقع تحتوي على كل من حالات التكلس والجماعية ، بالإضافة إلى المسارات الخالية من العيوب. تم تصميمه كمهمة تصنيف تقليدية من 5 فئات.

  • حجم التحميل : 2.01 MiB

  • حجم مجموعة البيانات : 801.46 MiB

  • الانقسامات :

ينقسم أمثلة
'test' 9770
'train' 49780
'validation' 5،580
  • هيكل الميزة :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
بطاقة تعريف نص خيط
صورة صورة (لا شيء ، لا شيء ، 1) uint8
ملصق ClassLabel int64

التصور

curated_breast_imaging_ddsm / original-calc

  • وصف التكوين : الصور الأصلية لحالات التكلس مضغوطة في PNG بدون فقدان بيانات.

  • حجم التحميل : 1.06 MiB

  • حجم مجموعة البيانات : 4.42 GiB

  • الانقسامات :

ينقسم أمثلة
'test' 284
'train' 1،227
  • هيكل الميزة :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
شذوذ تسلسل
الشذوذ / التقييم ClassLabel int64
الشذوذ / calc_distribution ClassLabel int64
شذوذ / نوع الكالس ClassLabel int64
شذوذ / معرف موتر int32
تشوهات / قناع صورة (لا شيء ، لا شيء ، 1) uint8
تشوهات / علم الأمراض ClassLabel int64
شذوذ / دقة ClassLabel int64
صدر ClassLabel int64
بطاقة تعريف نص خيط
صورة صورة (لا شيء ، لا شيء ، 1) uint8
مريض نص خيط
منظر ClassLabel int64

التصور

curated_breast_imaging_ddsm / original-mass

  • وصف التكوين : الصور الأصلية للحالات الضخمة مضغوطة في PNG بدون فقدان بيانات.

  • حجم التحميل : 966.57 KiB

  • حجم مجموعة البيانات : 4.80 GiB

  • الانقسامات :

ينقسم أمثلة
'test' 348
'train' 1166
  • هيكل الميزة :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
شذوذ تسلسل
الشذوذ / التقييم ClassLabel int64
شذوذ / معرف موتر int32
تشوهات / قناع صورة (لا شيء ، لا شيء ، 1) uint8
الشذوذ / الهوامش الجماعية ClassLabel int64
شذوذ / شكل كتلة ClassLabel int64
تشوهات / علم الأمراض ClassLabel int64
شذوذ / دقة ClassLabel int64
صدر ClassLabel int64
بطاقة تعريف نص خيط
صورة صورة (لا شيء ، لا شيء ، 1) uint8
مريض نص خيط
منظر ClassLabel int64

التصور