क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम,क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम

सीबीआईएस-डीडीएसएम (डीडीएसएम का क्यूरेटेड ब्रेस्ट इमेजिंग सबसेट) स्क्रीनिंग मैमोग्राफी (डीडीएसएम) के लिए डिजिटल डेटाबेस का एक अद्यतन और मानकीकृत संस्करण है। डीडीएसएम 2,620 स्कैन की गई फिल्म मैमोग्राफी अध्ययनों का एक डेटाबेस है। इसमें सत्यापित रोगविज्ञान जानकारी के साथ सामान्य, सौम्य और घातक मामले शामिल हैं।

पारंपरिक छवि वर्गीकरण सेटिंग में कार्य को हल करने के लिए, ( http://arxiv.org/abs/1708.09427 ) के विवरण के बाद, डिफ़ॉल्ट कॉन्फ़िगरेशन मूल मैमोग्राम से निकाले गए पैच से बना है।

क्योंकि डेटासेट में मौजूद छवियों को डाउनलोड करने और पढ़ने के लिए विशेष सॉफ़्टवेयर और लाइब्रेरी की आवश्यकता होती है, TFDS मानता है कि उपयोगकर्ता ने मूल DCIM फ़ाइलें डाउनलोड कर ली हैं और उन्हें PNG में परिवर्तित कर दिया है।

प्रतिलिपि प्रस्तुत करने योग्य परिणामों की गारंटी के लिए, पीएनजी फ़ाइलें उत्पन्न करने के लिए निम्नलिखित कमांड (या समतुल्य) का उपयोग किया जाना चाहिए:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

परिणामी छवियों को manual_dir में रखा जाना चाहिए, जैसे: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम/पैच (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िगरेशन विवरण : कैल्सीफिकेशन और बड़े पैमाने पर दोनों मामलों वाले पैच, साथ ही बिना किसी असामान्यता वाले पथ। पारंपरिक 5-श्रेणी वर्गीकरण कार्य के रूप में डिज़ाइन किया गया।

  • डाउनलोड आकार : 2.01 MiB

  • डेटासेट का आकार : 801.46 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 9,770
'train' 49,780
'validation' 5,580
  • फ़ीचर संरचना :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
पहचान मूलपाठ डोरी
छवि छवि (कोई नहीं, कोई नहीं, 1) uint8
लेबल क्लास लेबल int64

VISUALIZATION

क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम/ओरिजिनल-कैल्क

  • कॉन्फ़िगरेशन विवरण : दोषरहित पीएनजी में संपीड़ित कैल्सीफिकेशन मामलों की मूल छवियां।

  • डाउनलोड आकार : 1.06 MiB

  • डेटासेट का आकार : 4.42 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 284
'train' 1,227
  • फ़ीचर संरचना :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
असामान्यताएं अनुक्रम
असामान्यताएं/मूल्यांकन क्लास लेबल int64
असामान्यताएं/calc_distribution क्लास लेबल int64
असामान्यताएं/calc_type क्लास लेबल int64
असामान्यताएं/आईडी टेन्सर int32
असामान्यताएं/मुखौटा छवि (कोई नहीं, कोई नहीं, 1) uint8
असामान्यताएं/विकृति क्लास लेबल int64
असामान्यताएँ/सूक्ष्मताएँ क्लास लेबल int64
स्तन क्लास लेबल int64
पहचान मूलपाठ डोरी
छवि छवि (कोई नहीं, कोई नहीं, 1) uint8
मरीज़ मूलपाठ डोरी
देखना क्लास लेबल int64

VISUALIZATION

क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम/ओरिजिनल-मास

  • कॉन्फ़िगरेशन विवरण : दोषरहित पीएनजी में संपीड़ित बड़े मामलों की मूल छवियां।

  • डाउनलोड आकार : 966.57 KiB

  • डेटासेट का आकार : 4.80 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 348
'train' 1,166
  • फ़ीचर संरचना :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
असामान्यताएं अनुक्रम
असामान्यताएं/मूल्यांकन क्लास लेबल int64
असामान्यताएं/आईडी टेन्सर int32
असामान्यताएं/मुखौटा छवि (कोई नहीं, कोई नहीं, 1) uint8
असामान्यताएं/द्रव्यमान_मार्जिन क्लास लेबल int64
असामान्यताएं/द्रव्यमान_आकार क्लास लेबल int64
असामान्यताएं/विकृति क्लास लेबल int64
असामान्यताएँ/सूक्ष्मताएँ क्लास लेबल int64
स्तन क्लास लेबल int64
पहचान मूलपाठ डोरी
छवि छवि (कोई नहीं, कोई नहीं, 1) uint8
मरीज़ मूलपाठ डोरी
देखना क्लास लेबल int64

VISUALIZATION