curated_breast_imaging_ddsm

  • شرح :

CBIS-DDSM (زیر مجموعه تصویربرداری سینه انتخاب شده DDSM) نسخه به روز شده و استاندارد شده پایگاه داده دیجیتال برای غربالگری ماموگرافی (DDSM) است. DDSM یک پایگاه داده از 2620 مطالعه ماموگرافی فیلم اسکن شده است. این شامل موارد طبیعی، خوش خیم و بدخیم با اطلاعات پاتولوژی تایید شده است.

پیکربندی پیش‌فرض از تکه‌هایی ساخته شده است که از ماموگرافی‌های اصلی استخراج شده‌اند، به دنبال شرح ( http://arxiv.org/abs/1708.09427 )، به منظور قاب‌بندی کار برای حل در یک تنظیم طبقه‌بندی تصویر سنتی.

از آنجایی که برای دانلود و خواندن تصاویر موجود در مجموعه داده به نرم افزار و کتابخانه های خاصی نیاز است، TFDS فرض می کند که کاربر فایل های اصلی DCIM را دانلود کرده و آنها را به PNG تبدیل کرده است.

دستورات زیر (یا معادل آن) باید برای تولید فایل‌های PNG استفاده شوند تا نتایج قابل تکرار را تضمین کنند:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

تصاویر حاصل باید در manual_dir قرار داده شوند، مانند: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

  • ذخیره خودکار ( اسناد ): خیر

  • کلیدهای نظارت شده (به as_supervised doc مراجعه کنید): None

  • نقل قول :

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (پیکربندی پیش‌فرض)

  • توضیحات پیکربندی : وصله‌هایی که حاوی موارد کلسیفیکاسیون و جرم هستند، به علاوه مسیرهایی بدون ناهنجاری. به عنوان یک کار طبقه بندی 5 کلاسه سنتی طراحی شده است.

  • حجم دانلود : 2.01 MiB

  • حجم مجموعه داده : 801.46 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 9770
'train' 49780
'validation' 5,580
  • ساختار ویژگی :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
شناسه متن رشته
تصویر تصویر (هیچ، هیچ، 1) uint8
برچسب ClassLabel int64

تجسم

curated_breast_imaging_ddsm/original-calc

  • توضیحات پیکربندی : تصاویر اصلی از موارد کلسیفیکاسیون فشرده شده در PNG بدون اتلاف.

  • حجم دانلود : 1.06 MiB

  • حجم مجموعه داده : 4.42 GiB

  • تقسیم ها :

شکاف مثال ها
'test' 284
'train' 1,227
  • ساختار ویژگی :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
ناهنجاری ها توالی
ناهنجاری ها/ارزیابی ClassLabel int64
ناهنجاری ها / توزیع_کالک ClassLabel int64
ناهنجاری/نوع کالک ClassLabel int64
ناهنجاری ها / شناسه تانسور int32
ناهنجاری / ماسک تصویر (هیچ، هیچ، 1) uint8
ناهنجاری ها / آسیب شناسی ClassLabel int64
ناهنجاری/ظرافت ClassLabel int64
پستان ClassLabel int64
شناسه متن رشته
تصویر تصویر (هیچ، هیچ، 1) uint8
صبور متن رشته
چشم انداز ClassLabel int64

تجسم

curated_breast_imaging_ddsm/original-mass

  • توضیحات پیکربندی : تصاویر اصلی از کیس های انبوه فشرده شده در PNG بدون اتلاف.

  • حجم دانلود : 966.57 KiB

  • حجم مجموعه داده : 4.80 GiB

  • تقسیم ها :

شکاف مثال ها
'test' 348
'train' 1,166
  • ساختار ویژگی :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
ناهنجاری ها توالی
ناهنجاری ها/ارزیابی ClassLabel int64
ناهنجاری / شناسه تانسور int32
ناهنجاری / ماسک تصویر (هیچ، هیچ، 1) uint8
ناهنجاری/حاشیه_انبوه ClassLabel int64
ناهنجاری/شکل_ جرمی ClassLabel int64
ناهنجاری ها / آسیب شناسی ClassLabel int64
ناهنجاری/ظرافت ClassLabel int64
پستان ClassLabel int64
شناسه متن رشته
تصویر تصویر (هیچ، هیچ، 1) uint8
صبور متن رشته
چشم انداز ClassLabel int64

تجسم