- Descrição :
Esta é uma tarefa de regressão, onde o objetivo é prever a área ardida por incêndios florestais, na região nordeste de Portugal, usando dados meteorológicos e outros.
Informações do conjunto de dados:
Em [Cortez e Morais, 2007], a 'área' de saída foi primeiro transformada com uma função ln(x+1). Em seguida, vários métodos de Data Mining foram aplicados. Após o ajuste dos modelos, as saídas foram pós-processadas com o inverso da transformada ln(x+1). Quatro configurações de entrada diferentes foram usadas. Os experimentos foram conduzidos usando 10 vezes (validação cruzada) x 30 execuções. Duas métricas de regressão foram medidas: MAD e RMSE. Uma máquina Gaussiana de vetores de suporte (SVM) alimentada com apenas 4 condições climáticas diretas (temperatura, UR, vento e chuva) obteve o melhor valor de MAD: 12,71 +- 0,01 (média e intervalo de confiança dentro de 95% usando uma distribuição t-student). O melhor RMSE foi obtido pelo preditor de média ingênuo. Uma análise da curva de erro de regressão (REC) mostra que o modelo SVM prevê mais exemplos dentro de um menor erro admitido. Com efeito, o modelo SVM prevê melhor os pequenos incêndios, que são a maioria.
Informações do atributo:
Para mais informações, leia [Cortez e Morais, 2007].
- X - coordenada espacial do eixo x no mapa do parque de Montesinho: 1 a 9
- Y - coordenada espacial do eixo y no mapa do parque de Montesinho: 2 a 9
- mês - mês do ano: 'jan' a 'dez'
- dia - dia da semana: 'seg' a 'sol'
- FFMC - índice FFMC do sistema FWI: 18,7 a 96,20
- DMC - índice DMC do sistema FWI: 1,1 a 291,3
- DC - índice DC do sistema FWI: 7,9 a 860,6
- ISI - índice ISI do sistema FWI: 0,0 a 56,10
- temp - temperatura em graus Celsius: 2,2 a 33,30
- UR - umidade relativa em %: 15,0 a 100
- vento - velocidade do vento em km/h: 0,40 a 9,40
- chuva - chuva externa em mm/m2: 0,0 a 6,4
- área - a área queimada da floresta (em ha): 0,00 a 1090,84 (esta variável de saída é muito enviesada para 0,0, portanto pode fazer sentido modelar com a transformada logarítmica).
Página inicial : https://archive.ics.uci.edu/ml/datasets/Forest+Fires
Código -fonte:
tfds.structured.ForestFires
Versões :
-
0.0.1
(padrão): sem notas de versão.
-
Tamanho do download :
24.88 KiB
Tamanho do conjunto de dados :
162.07 KiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'train' | 517 |
- Estrutura de recursos :
FeaturesDict({
'area': float32,
'features': FeaturesDict({
'DC': float32,
'DMC': float32,
'FFMC': float32,
'ISI': float32,
'RH': float32,
'X': uint8,
'Y': uint8,
'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
'rain': float32,
'temp': float32,
'wind': float32,
}),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
área | tensor | float32 | ||
recursos | RecursosDict | |||
características/DC | tensor | float32 | ||
recursos/DMC | tensor | float32 | ||
recursos/FFMC | tensor | float32 | ||
características/ISI | tensor | float32 | ||
características/RH | tensor | float32 | ||
características/X | tensor | uint8 | ||
características/Y | tensor | uint8 | ||
recursos/dia | ClassLabel | int64 | ||
características/mês | ClassLabel | int64 | ||
características/chuva | tensor | float32 | ||
características/temperatura | tensor | float32 | ||
características/vento | tensor | float32 |
Chaves supervisionadas (consulte o documento
as_supervised
):('area', 'features')
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }
@article{cortez2007data,
title={A data mining approach to predict forest fires using meteorological data},
author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
year={2007},
publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}