- Descrição :
Medições para três espécies de pinguins observadas no Arquipélago Palmer, Antártica.
Esses dados foram coletados de 2007-2009 pela Dra. Kristen Gorman com o Programa de Pesquisa Ecológica de Longo Prazo da Estação Palmer , parte da Rede de Pesquisa Ecológica de Longo Prazo dos EUA . Os dados foram originalmente importados do Portal de Dados da Iniciativa de Dados Ambientais (EDI) e estão disponíveis para uso pela licença CC0 ("Sem Direitos Reservados") de acordo com a Política de Dados da Palmer Station. Esta cópia foi importada do repositório GitHub de Allison Horst .
Página inicial : https://allisonhorst.github.io/palmerpenguins/
Código -fonte:
tfds.datasets.penguins.Builder
Versões :
-
1.0.0
(padrão): versão inicial.
-
Cache automático ( documentação ): Sim
Figura ( tfds.show_examples ): Não compatível.
Citação :
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
pinguins/processado (configuração padrão)
Descrição da configuração :
penguins/processed
é um substituto para o conjunto de dados dairis
. Ele contém 4 recursos numéricos normalizados apresentados como um único tensor, sem valores ausentes e o rótulo da classe (espécie) é apresentado como um número inteiro (n = 334).Tamanho do download :
25.05 KiB
Tamanho do conjunto de dados :
17.61 KiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 334 |
- Estrutura de recursos :
FeaturesDict({
'features': Tensor(shape=(4,), dtype=float32),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Documentação do recurso:
Funcionalidade | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
recursos | tensor | (4,) | float32 | |
espécies | ClassLabel | int64 |
Chaves supervisionadas (ver
as_supervised
doc ):('features', 'species')
Exemplos ( tfds.as_dataframe ):
pinguins/simples
Descrição da configuração :
penguins/simple
foi processado a partir do conjunto de dados brutos, com rótulos de classe simplificados derivados de campos de texto, valores ausentes marcados como NaN/NA e retém apenas 7 recursos significativos (n = 344).Tamanho do download :
13.20 KiB
Tamanho do conjunto de dados :
56.10 KiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 344 |
- Estrutura de recursos :
FeaturesDict({
'body_mass_g': float32,
'culmen_depth_mm': float32,
'culmen_length_mm': float32,
'flipper_length_mm': float32,
'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Documentação do recurso:
Funcionalidade | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
body_mass_g | tensor | float32 | ||
culmen_depth_mm | tensor | float32 | ||
culmen_length_mm | tensor | float32 | ||
flipper_length_mm | tensor | float32 | ||
ilha | ClassLabel | int64 | ||
sexo | ClassLabel | int64 | ||
espécies | ClassLabel | int64 |
Chaves supervisionadas (Consulte
as_supervised
doc ):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')
Exemplos ( tfds.as_dataframe ):
pinguins/cru
Descrição da configuração :
penguins/raw
é a cópia original e não processada de @allisonhorst, contendo todos os 17 recursos, apresentados como tipos numéricos ou como texto bruto (n = 344).Tamanho do download :
49.72 KiB
Tamanho do conjunto de dados :
164.51 KiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 344 |
- Estrutura de recursos :
FeaturesDict({
'Body Mass (g)': float32,
'Clutch Completion': Text(shape=(), dtype=string),
'Comments': Text(shape=(), dtype=string),
'Culmen Depth (mm)': float32,
'Culmen Length (mm)': float32,
'Date Egg': Text(shape=(), dtype=string),
'Delta 13 C (o/oo)': float32,
'Delta 15 N (o/oo)': float32,
'Flipper Length (mm)': float32,
'Individual ID': Text(shape=(), dtype=string),
'Island': Text(shape=(), dtype=string),
'Region': Text(shape=(), dtype=string),
'Sample Number': int32,
'Sex': Text(shape=(), dtype=string),
'Species': Text(shape=(), dtype=string),
'Stage': Text(shape=(), dtype=string),
'studyName': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Funcionalidade | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
Massa Corporal (g) | tensor | float32 | ||
Conclusão da embreagem | Texto | fragmento | ||
Comentários | Texto | fragmento | ||
Profundidade do Culmen (mm) | tensor | float32 | ||
Comprimento do cúlmen (mm) | tensor | float32 | ||
Tâmara | Texto | fragmento | ||
Delta 13 C (o/oo) | tensor | float32 | ||
Delta 15 N (o/oo) | tensor | float32 | ||
Comprimento da nadadeira (mm) | tensor | float32 | ||
ID individual | Texto | fragmento | ||
Ilha | Texto | fragmento | ||
Região | Texto | fragmento | ||
Número da amostra | tensor | int32 | ||
Sexo | Texto | fragmento | ||
Espécies | Texto | fragmento | ||
Etapa | Texto | fragmento | ||
nome do estudo | Texto | fragmento |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Exemplos ( tfds.as_dataframe ):