imagenet_pi

  • Descrição :

ImageNet-PI é uma versão renomeada do conjunto de dados padrão ILSVRC2012 ImageNet no qual os rótulos são fornecidos por uma coleção de 16 redes neurais profundas com diferentes arquiteturas pré-treinadas no padrão ILSVRC2012. Especificamente, os modelos pré-treinados são baixados de tf.keras.applications.

Além dos novos rótulos, o ImageNet-PI também fornece metadados sobre o processo de anotação na forma de confidências dos modelos em seus rótulos e informações adicionais sobre cada modelo.

Para mais informações, consulte: ImageNet-PI

  • Página inicial : https://github.com/google-research-datasets/imagenet_pi/

  • Código-fonte : tfds.datasets.imagenet_pi.Builder

  • Versões :

    • 1.0.0 (padrão): versão inicial.
  • Tamanho do download : Unknown size

  • Tamanho do conjunto de dados : Unknown size

  • Instruções de download manual : este conjunto de dados exige que você baixe os dados de origem manualmente em download_config.manual_dir (o padrão é ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir deve conter dois arquivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Você precisa se registrar em http://www.image-net.org/download-images para obter o link para baixar o conjunto de dados.

  • Armazenado em cache automaticamente ( documentação ): Desconhecido

  • Divisões :

Dividir Exemplos
  • Estrutura de recursos :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • Documentação do recurso :
Recurso Aula Forma Tipo D Descrição
RecursosDict
anotador_confianças tensor (16,) float32
anotator_labels tensor (16,) int64
clean_label ClassLabel int64
nome do arquivo Texto corda
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
,

  • Descrição :

ImageNet-PI é uma versão renomeada do conjunto de dados padrão ILSVRC2012 ImageNet no qual os rótulos são fornecidos por uma coleção de 16 redes neurais profundas com diferentes arquiteturas pré-treinadas no padrão ILSVRC2012. Especificamente, os modelos pré-treinados são baixados de tf.keras.applications.

Além dos novos rótulos, o ImageNet-PI também fornece metadados sobre o processo de anotação na forma de confidências dos modelos em seus rótulos e informações adicionais sobre cada modelo.

Para mais informações, consulte: ImageNet-PI

  • Página inicial : https://github.com/google-research-datasets/imagenet_pi/

  • Código-fonte : tfds.datasets.imagenet_pi.Builder

  • Versões :

    • 1.0.0 (padrão): versão inicial.
  • Tamanho do download : Unknown size

  • Tamanho do conjunto de dados : Unknown size

  • Instruções de download manual : este conjunto de dados exige que você baixe os dados de origem manualmente em download_config.manual_dir (o padrão é ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir deve conter dois arquivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Você precisa se registrar em http://www.image-net.org/download-images para obter o link para baixar o conjunto de dados.

  • Armazenado em cache automaticamente ( documentação ): Desconhecido

  • Divisões :

Dividir Exemplos
  • Estrutura de recursos :
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • Documentação do recurso :
Recurso Aula Forma Tipo D Descrição
RecursosDict
anotador_confianças tensor (16,) float32
anotator_labels tensor (16,) int64
clean_label ClassLabel int64
nome do arquivo Texto corda
imagem Imagem (Nenhuma, Nenhuma, 3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}