curadoria_breast_imaging_ddsm

  • Descrição :

O CBIS-DDSM (Curated Breast Imaging Subset of DDSM) é uma versão atualizada e padronizada do Banco de Dados Digital para Mamografia de Triagem (DDSM). O DDSM é um banco de dados de 2.620 estudos de mamografia digitalizada. Ele contém casos normais, benignos e malignos com informações patológicas verificadas.

A configuração padrão é feita de patches extraídos das mamografias originais, seguindo a descrição de ( http://arxiv.org/abs/1708.09427 ), a fim de enquadrar a tarefa a ser resolvida em um ambiente tradicional de classificação de imagens.

Como são necessários software e bibliotecas especiais para baixar e ler as imagens contidas no conjunto de dados, o TFDS assume que o usuário baixou os arquivos DCIM originais e os converteu para PNG.

Os seguintes comandos (ou equivalentes) devem ser usados ​​para gerar os arquivos PNG, a fim de garantir resultados reproduzíveis:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs
-n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

As imagens resultantes devem ser colocadas em manual_dir , como: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi
= {10.7937/k9/tcia.2016.7o02s9cy},
  url
= {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author
= {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title
= {Curated Breast Imaging Subset of DDSM},
  publisher
= {The Cancer Imaging Archive},
  year
= {2016},
}
@article{TCIA_Citation,
  author
= {
    K
. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P
. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L
. Tarbox and F. Prior
 
},
  title
= { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
 
Public Information Repository} },
  journal
= {Journal of Digital Imaging},
  volume
= {26},
  month
= {December},
  year
= {2013},
  pages
= {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    
= {Li Shen},
  title    
= {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               
An All Convolutional Design},
  journal  
= {CoRR},
  volume    
= {abs/1708.09427},
  year      
= {2017},
  url      
= {http://arxiv.org/abs/1708.09427},
  archivePrefix
= {arXiv},
  eprint    
= {1708.09427},
  timestamp
= {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    
= {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource
= {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (configuração padrão)

  • Descrição da configuração : Patches contendo casos de calsificação e massa, além de caminhos sem anormalidades. Projetado como uma tarefa tradicional de classificação de 5 classes.

  • Tamanho do download : 2.01 MiB

  • Tamanho do conjunto de dados : 801.46 MiB

  • Divisões :

Dividir Exemplos
'test' 9.770
'train' 49.780
'validation' 5.580
  • Estrutura de recursos :
FeaturesDict({
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
eu ia Texto corda
imagem Imagem (Nenhum, Nenhum, 1) uint8
rótulo ClassLabel int64

Visualização

curated_breast_imaging_ddsm/original-calc

  • Descrição da configuração : Imagens originais dos casos de calcificação compactadas em PNG sem perdas.

  • Tamanho do download : 1.06 MiB

  • Tamanho do conjunto de dados : 4.42 GiB

  • Divisões :

Dividir Exemplos
'test' 284
'train' 1.227
  • Estrutura de recursos :
FeaturesDict({
   
'abnormalities': Sequence({
       
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
       
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
       
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
       
'id': int32,
       
'mask': Image(shape=(None, None, 1), dtype=uint8),
       
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
       
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
   
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'patient': Text(shape=(), dtype=string),
   
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
anormalidades Seqüência
anormalidades/avaliação ClassLabel int64
anormalidades/calc_distribution ClassLabel int64
anormalidades/calc_type ClassLabel int64
anormalidades/id Tensor int32
anormalidades/máscara Imagem (Nenhum, Nenhum, 1) uint8
anomalias/patologia ClassLabel int64
anormalidades/sutileza ClassLabel int64
seios ClassLabel int64
eu ia Texto corda
imagem Imagem (Nenhum, Nenhum, 1) uint8
paciente Texto corda
visualizar ClassLabel int64

Visualização

curated_breast_imaging_ddsm/original-mass

  • Descrição da configuração : imagens originais dos casos em massa compactadas em PNG sem perdas.

  • Tamanho do download : 966.57 KiB

  • Tamanho do conjunto de dados : 4.80 GiB

  • Divisões :

Dividir Exemplos
'test' 348
'train' 1.166
  • Estrutura de recursos :
FeaturesDict({
   
'abnormalities': Sequence({
       
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
       
'id': int32,
       
'mask': Image(shape=(None, None, 1), dtype=uint8),
       
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
       
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
       
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
       
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
   
}),
   
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 1), dtype=uint8),
   
'patient': Text(shape=(), dtype=string),
   
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
anormalidades Seqüência
anormalidades/avaliação ClassLabel int64
anormalidades/id Tensor int32
anormalidades/máscara Imagem (Nenhum, Nenhum, 1) uint8
anormalidades/margens_de_massa ClassLabel int64
anormalidades/forma_massa ClassLabel int64
anomalias/patologia ClassLabel int64
anormalidades/sutileza ClassLabel int64
seios ClassLabel int64
eu ia Texto corda
imagem Imagem (Nenhum, Nenhum, 1) uint8
paciente Texto corda
visualizar ClassLabel int64

Visualização