curated_breast_imaging_ddsm,curated_breast_imaging_ddsm

CBIS-DDSM (Curated Breast Imaging Subset of DDSM) เป็นฐานข้อมูลดิจิทัลสำหรับการคัดกรองเต้านม (DDSM) รุ่นปรับปรุงและเป็นมาตรฐาน DDSM เป็นฐานข้อมูลของการศึกษาเอกซเรย์เต้านมด้วยฟิล์มสแกน 2,620 ชิ้น ประกอบด้วยกรณีปกติ อ่อนโยน และร้ายกาจพร้อมข้อมูลทางพยาธิวิทยาที่ผ่านการตรวจสอบแล้ว

การกำหนดค่าเริ่มต้นทำจากแพตช์ที่ดึงมาจากแมมโมแกรมต้นฉบับ ตามคำอธิบายจาก ( http://arxiv.org/abs/1708.09427 ) เพื่อวางกรอบงานที่ต้องแก้ไขในการตั้งค่าการจัดประเภทภาพแบบดั้งเดิม

เนื่องจากจำเป็นต้องใช้ซอฟต์แวร์และไลบรารีพิเศษในการดาวน์โหลดและอ่านอิมเมจที่มีอยู่ในชุดข้อมูล TFDS จะถือว่าผู้ใช้ดาวน์โหลดไฟล์ DCIM ต้นฉบับและแปลงเป็น PNG

ควรใช้คำสั่งต่อไปนี้ (หรือเทียบเท่า) เพื่อสร้างไฟล์ PNG เพื่อรับประกันผลลัพธ์ที่ทำซ้ำได้:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

รูปภาพผลลัพธ์ควรใส่ใน manual_dir เช่น: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (การกำหนดค่าเริ่มต้น)

  • คำอธิบายการกำหนดค่า : แพตช์ที่มีทั้งแคลซิฟิเคชันและมวลรวม รวมถึงพาธซีที่ไม่มีความผิดปกติ ออกแบบเป็นงานจำแนกประเภท 5 ชั้นแบบดั้งเดิม

  • ขนาดการดาวน์โหลด : 2.01 MiB

  • ขนาดชุดข้อมูล : 801.46 MiB

  • แยก :

แยก ตัวอย่าง
'test' 9,770
'train' 49,780
'validation' 5,580
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
รหัส ข้อความ สตริง
ภาพ ภาพ (ไม่มี, ไม่มี, 1) uint8
ฉลาก ป้ายกำกับคลาส int64

การสร้างภาพ

curated_breast_imaging_ddsm/original-calc

  • คำอธิบายการกำหนดค่า : ภาพต้นฉบับของกรณีการกลายเป็นปูนที่ถูกบีบอัดใน PNG แบบไม่สูญเสียข้อมูล

  • ขนาดการดาวน์โหลด : 1.06 MiB

  • ขนาดชุดข้อมูล : 4.42 GiB

  • แยก :

แยก ตัวอย่าง
'test' 284
'train' 1,227
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ความผิดปกติ ลำดับ
ความผิดปกติ/การประเมิน ป้ายกำกับคลาส int64
ความผิดปกติ/calc_distribution ป้ายกำกับคลาส int64
ความผิดปกติ/calc_type ป้ายกำกับคลาส int64
ความผิดปกติ/id เทนเซอร์ int32
ความผิดปกติ/หน้ากาก ภาพ (ไม่มี, ไม่มี, 1) uint8
ความผิดปกติ/พยาธิสภาพ ป้ายกำกับคลาส int64
ความผิดปกติ/ความละเอียดอ่อน ป้ายกำกับคลาส int64
หน้าอก ป้ายกำกับคลาส int64
รหัส ข้อความ สตริง
ภาพ ภาพ (ไม่มี, ไม่มี, 1) uint8
อดทน ข้อความ สตริง
ดู ป้ายกำกับคลาส int64

การสร้างภาพ

curated_breast_imaging_ddsm/original-mass

  • คำอธิบายการกำหนดค่า : ภาพต้นฉบับของกรณีจำนวนมากที่บีบอัดใน PNG แบบไม่สูญเสียข้อมูล

  • ขนาดการดาวน์โหลด : 966.57 KiB

  • ขนาดชุดข้อมูล : 4.80 GiB

  • แยก :

แยก ตัวอย่าง
'test' 348
'train' 1,166
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ความผิดปกติ ลำดับ
ความผิดปกติ/การประเมิน ป้ายกำกับคลาส int64
ความผิดปกติ/id เทนเซอร์ int32
ความผิดปกติ/หน้ากาก ภาพ (ไม่มี, ไม่มี, 1) uint8
ความผิดปกติ/mass_margins ป้ายกำกับคลาส int64
ความผิดปกติ/mass_shape ป้ายกำกับคลาส int64
ความผิดปกติ/พยาธิสภาพ ป้ายกำกับคลาส int64
ความผิดปกติ/ความละเอียดอ่อน ป้ายกำกับคลาส int64
หน้าอก ป้ายกำกับคลาส int64
รหัส ข้อความ สตริง
ภาพ ภาพ (ไม่มี, ไม่มี, 1) uint8
อดทน ข้อความ สตริง
ดู ป้ายกำกับคลาส int64

การสร้างภาพ