curated_breast_imaging_ddsm

  • شرح :

CBIS-DDSM (زیر مجموعه تصویربرداری سینه انتخاب شده DDSM) نسخه به روز شده و استاندارد شده پایگاه داده دیجیتال برای غربالگری ماموگرافی (DDSM) است. DDSM یک پایگاه داده از 2620 مطالعه ماموگرافی فیلم اسکن شده است. این شامل موارد طبیعی، خوش خیم و بدخیم با اطلاعات پاتولوژی تایید شده است.

پیکربندی پیش‌فرض از تکه‌هایی ساخته شده است که از ماموگرافی‌های اصلی استخراج شده‌اند، به دنبال شرح ( http://arxiv.org/abs/1708.09427 )، به منظور قاب‌بندی کار برای حل در یک تنظیم طبقه‌بندی تصویر سنتی.

از آنجایی که برای دانلود و خواندن تصاویر موجود در مجموعه داده به نرم افزار و کتابخانه های خاصی نیاز است، TFDS فرض می کند که کاربر فایل های اصلی DCIM را دانلود کرده و آنها را به PNG تبدیل کرده است.

دستورات زیر (یا معادل آن) باید برای تولید فایل‌های PNG استفاده شوند تا نتایج قابل تکرار را تضمین کنند:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs
-n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

تصاویر حاصل باید در manual_dir قرار داده شوند، مانند: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

  • ذخیره خودکار ( اسناد ): خیر

  • کلیدهای نظارت شده (به as_supervised doc مراجعه کنید): None

  • نقل قول :

@misc{CBIS_DDSM_Citation,
  doi
= {10.7937/k9/tcia.2016.7o02s9cy},
  url
= {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author
= {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title
= {Curated Breast Imaging Subset of DDSM},
  publisher
= {The Cancer Imaging Archive},
  year
= {2016},
}
@article{TCIA_Citation,
  author
= {
    K
. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P
. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L
. Tarbox and F. Prior
 
},
  title
= { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
 
Public Information Repository} },
  journal
= {Journal of Digital Imaging},
  volume
= {26},
  month
= {December},
  year
= {2013},
  pages
= {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    
= {Li Shen},
  title    
= {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               
An All Convolutional Design},
  journal  
= {CoRR},
  volume    
= {abs/1708.09427},
  year      
= {2017},
  url      
= {http://arxiv.org/abs/1708.09427},
  archivePrefix
= {arXiv},
  eprint    
= {1708.09427},
  timestamp
= {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    
= {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource
= {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (پیکربندی پیش‌فرض)

  • توضیحات پیکربندی : وصله‌هایی که حاوی موارد کلسیفیکاسیون و جرم هستند، به علاوه مسیرهایی بدون ناهنجاری. به عنوان یک کار طبقه بندی 5 کلاسه سنتی طراحی شده است.

  • حجم دانلود : 2.01 MiB

  • حجم مجموعه داده : 801.46 MiB

  • تقسیم ها :

شکاف مثال ها
'test' 9770
'train' 49780
'validation' 5,580
  • ساختار ویژگی :
FeaturesDict({
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
شناسه متن رشته
تصویر تصویر (هیچ، هیچ، 1) uint8
برچسب ClassLabel int64

تجسم

curated_breast_imaging_ddsm/original-calc

  • توضیحات پیکربندی : تصاویر اصلی از موارد کلسیفیکاسیون فشرده شده در PNG بدون اتلاف.

  • حجم دانلود : 1.06 MiB

  • حجم مجموعه داده : 4.42 GiB

  • تقسیم ها :

شکاف مثال ها
'test' 284
'train' 1,227
  • ساختار ویژگی :
FeaturesDict({
   
'abnormalities': Sequence({
       
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
       
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
       
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
       
'id': int32,
       
'mask': Image(shape=(None, None, 1), dtype=uint8),
       
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
       
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
   
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'patient': Text(shape=(), dtype=string),
   
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
ناهنجاری ها توالی
ناهنجاری ها/ارزیابی ClassLabel int64
ناهنجاری ها / توزیع_کالک ClassLabel int64
ناهنجاری/نوع کالک ClassLabel int64
ناهنجاری ها / شناسه تانسور int32
ناهنجاری / ماسک تصویر (هیچ، هیچ، 1) uint8
ناهنجاری ها / آسیب شناسی ClassLabel int64
ناهنجاری/ظرافت ClassLabel int64
پستان ClassLabel int64
شناسه متن رشته
تصویر تصویر (هیچ، هیچ، 1) uint8
صبور متن رشته
چشم انداز ClassLabel int64

تجسم

curated_breast_imaging_ddsm/original-mass

  • توضیحات پیکربندی : تصاویر اصلی از کیس های انبوه فشرده شده در PNG بدون اتلاف.

  • حجم دانلود : 966.57 KiB

  • حجم مجموعه داده : 4.80 GiB

  • تقسیم ها :

شکاف مثال ها
'test' 348
'train' 1,166
  • ساختار ویژگی :
FeaturesDict({
   
'abnormalities': Sequence({
       
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
       
'id': int32,
       
'mask': Image(shape=(None, None, 1), dtype=uint8),
       
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
       
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
       
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
       
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
   
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'patient': Text(shape=(), dtype=string),
   
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
ناهنجاری ها توالی
ناهنجاری ها/ارزیابی ClassLabel int64
ناهنجاری / شناسه تانسور int32
ناهنجاری / ماسک تصویر (هیچ، هیچ، 1) uint8
ناهنجاری/حاشیه_انبوه ClassLabel int64
ناهنجاری/شکل_ جرمی ClassLabel int64
ناهنجاری ها / آسیب شناسی ClassLabel int64
ناهنجاری/ظرافت ClassLabel int64
پستان ClassLabel int64
شناسه متن رشته
تصویر تصویر (هیچ، هیچ، 1) uint8
صبور متن رشته
چشم انداز ClassLabel int64

تجسم