- Descrição :
ImageNet-LT é um subconjunto do conjunto de dados ImageNet ILSVRC 2012 original. O conjunto de treinamento é subamostrado de forma que o número de imagens por classe segue uma distribuição de cauda longa. A classe com o número máximo de imagens contém 1.280 exemplos, enquanto a classe com o número mínimo de imagens contém apenas 5 exemplos. O conjunto de dados também possui um conjunto de validação balanceado, que também é um subconjunto do conjunto de treinamento ImageNet ILSVRC 2012 e contém 20 imagens por classe. O conjunto de teste deste conjunto de dados é o mesmo que o conjunto de validação do conjunto de dados ImageNet ILSVRC 2012 original.
O conjunto de dados ImageNet ILSVRC 2012 original deve ser baixado manualmente e seu caminho deve ser definido com --manual_dir para gerar esse conjunto de dados.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://github.com/zhmiao/OpenLongTailRecognition-OLTR
Código-fonte :
tfds.datasets.imagenet_lt.Builder
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
5.21 MiB
Tamanho do conjunto de dados :
20.92 GiB
Instruções de download manual : este conjunto de dados exige que você baixe os dados de origem manualmente em
download_config.manual_dir
(o padrão é~/tensorflow_datasets/downloads/manual/
):
manual_dir deve conter dois arquivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Você precisa se registrar em http://www.image-net.org/download-images para obter o link para baixar o conjunto de dados.Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 50.000 |
'train' | 115.846 |
'validation' | 20.000 |
- Estrutura de recursos :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Documentação do recurso :
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
nome do arquivo | Texto | corda | ||
imagem | Imagem | (Nenhuma, Nenhuma, 3) | uint8 | |
etiqueta | ClassLabel | int64 |
Chaves supervisionadas (Consulte
as_supervised
doc ):('image', 'label')
Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
- Citação :
\
@inproceedings{openlongtailrecognition,
title={Large-Scale Long-Tailed Recognition in an Open World},
author={Liu, Ziwei and Miao, Zhongqi and Zhan, Xiaohang and Wang, Jiayun and Gong, Boqing and Yu, Stella X.},
booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2019},
url={https://github.com/zhmiao/OpenLongTailRecognition-OLTR}
}