curated_breast_imaging_ddsm

  • Opis :

CBIS-DDSM (Curated Breast Imaging Subset of DDSM) to zaktualizowana i ujednolicona wersja cyfrowej bazy danych mammografii przesiewowej (DDSM). DDSM to baza danych zawierająca 2620 badań mammograficznych na kliszy skanowanej. Zawiera przypadki normalne, łagodne i złośliwe ze zweryfikowanymi informacjami o patologii.

Domyślna konfiguracja składa się z fragmentów wyodrębnionych z oryginalnych mammogramów, zgodnie z opisem z ( http://arxiv.org/abs/1708.09427 ), aby określić zadanie do rozwiązania w ramach tradycyjnego ustawienia klasyfikacji obrazów.

Ponieważ do pobrania i odczytania obrazów zawartych w zbiorze danych potrzebne jest specjalne oprogramowanie i biblioteki, TFDS zakłada, że ​​użytkownik pobrał oryginalne pliki DCIM i przekonwertował je do formatu PNG.

Aby wygenerować pliki PNG, należy użyć następujących poleceń (lub ich odpowiedników), aby zagwarantować powtarzalność wyników:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs
-n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Wynikowe obrazy należy umieścić w manual_dir , np.: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi
= {10.7937/k9/tcia.2016.7o02s9cy},
  url
= {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author
= {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title
= {Curated Breast Imaging Subset of DDSM},
  publisher
= {The Cancer Imaging Archive},
  year
= {2016},
}
@article{TCIA_Citation,
  author
= {
    K
. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P
. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L
. Tarbox and F. Prior
 
},
  title
= { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
 
Public Information Repository} },
  journal
= {Journal of Digital Imaging},
  volume
= {26},
  month
= {December},
  year
= {2013},
  pages
= {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    
= {Li Shen},
  title    
= {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               
An All Convolutional Design},
  journal  
= {CoRR},
  volume    
= {abs/1708.09427},
  year      
= {2017},
  url      
= {http://arxiv.org/abs/1708.09427},
  archivePrefix
= {arXiv},
  eprint    
= {1708.09427},
  timestamp
= {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    
= {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource
= {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (konfiguracja domyślna)

  • Opis konfiguracji : Poprawki zawierające przypadki zwapnienia i masy, a także ścieżki bez nieprawidłowości. Zaprojektowane jako tradycyjne zadanie klasyfikacji 5-klasowej.

  • Rozmiar pliku do pobrania : 2.01 MiB

  • Rozmiar zbioru danych : 801.46 MiB

  • Podziały :

Podział Przykłady
'test' 9770
'train' 49780
'validation' 5580
  • Struktura funkcji :
FeaturesDict({
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
ID Tekst strunowy
obraz Obraz (Brak, Brak, 1) uint8
etykieta Etykieta klasy int64

Wyobrażanie sobie

curated_breast_imaging_ddsm/original-calc

  • Opis konfiguracji : Oryginalne obrazy przypadków zwapnień skompresowane w bezstratnym formacie PNG.

  • Rozmiar pliku do pobrania : 1.06 MiB

  • Rozmiar zbioru danych : 4.42 GiB

  • Podziały :

Podział Przykłady
'test' 284
'train' 1227
  • Struktura funkcji :
FeaturesDict({
   
'abnormalities': Sequence({
       
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
       
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
       
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
       
'id': int32,
       
'mask': Image(shape=(None, None, 1), dtype=uint8),
       
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
       
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
   
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'patient': Text(shape=(), dtype=string),
   
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
nieprawidłowości Sekwencja
nieprawidłowości/ocena Etykieta klasy int64
nieprawidłowości/calc_distribution Etykieta klasy int64
nieprawidłowości/typ_calc Etykieta klasy int64
nieprawidłowości/id Napinacz int32
nieprawidłowości/maska Obraz (Brak, Brak, 1) uint8
nieprawidłowości/patologia Etykieta klasy int64
nieprawidłowości/subtelność Etykieta klasy int64
pierś Etykieta klasy int64
ID Tekst strunowy
obraz Obraz (Brak, Brak, 1) uint8
pacjent Tekst strunowy
pogląd Etykieta klasy int64

Wyobrażanie sobie

curated_breast_imaging_ddsm/original-mass

  • Opis konfiguracji : Oryginalne obrazy masowych przypadków skompresowane w bezstratnym formacie PNG.

  • Rozmiar pliku do pobrania : 966.57 KiB

  • Rozmiar zbioru danych : 4.80 GiB

  • Podziały :

Podział Przykłady
'test' 348
'train' 1166
  • Struktura funkcji :
FeaturesDict({
   
'abnormalities': Sequence({
       
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
       
'id': int32,
       
'mask': Image(shape=(None, None, 1), dtype=uint8),
       
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
       
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
       
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
       
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
   
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'patient': Text(shape=(), dtype=string),
   
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
nieprawidłowości Sekwencja
nieprawidłowości/ocena Etykieta klasy int64
nieprawidłowości/id Napinacz int32
nieprawidłowości/maska Obraz (Brak, Brak, 1) uint8
nieprawidłowości/marginesy_masy Etykieta klasy int64
nieprawidłowości/kształt_masy Etykieta klasy int64
nieprawidłowości/patologia Etykieta klasy int64
nieprawidłowości/subtelność Etykieta klasy int64
pierś Etykieta klasy int64
ID Tekst strunowy
obraz Obraz (Brak, Brak, 1) uint8
pacjent Tekst strunowy
pogląd Etykieta klasy int64

Wyobrażanie sobie