incêndios florestais

  • Descrição :

Esta é uma tarefa de regressão, onde o objetivo é prever a área ardida por incêndios florestais, na região nordeste de Portugal, usando dados meteorológicos e outros.

Informações do conjunto de dados:

Em [Cortez e Morais, 2007], a 'área' de saída foi primeiro transformada com uma função ln(x+1). Em seguida, vários métodos de Data Mining foram aplicados. Após o ajuste dos modelos, as saídas foram pós-processadas com o inverso da transformada ln(x+1). Quatro configurações de entrada diferentes foram usadas. Os experimentos foram conduzidos usando 10 vezes (validação cruzada) x 30 execuções. Duas métricas de regressão foram medidas: MAD e RMSE. Uma máquina Gaussiana de vetores de suporte (SVM) alimentada com apenas 4 condições climáticas diretas (temperatura, UR, vento e chuva) obteve o melhor valor de MAD: 12,71 +- 0,01 (média e intervalo de confiança dentro de 95% usando uma distribuição t-student). O melhor RMSE foi obtido pelo preditor de média ingênuo. Uma análise da curva de erro de regressão (REC) mostra que o modelo SVM prevê mais exemplos dentro de um menor erro admitido. Com efeito, o modelo SVM prevê melhor os pequenos incêndios, que são a maioria.

Informações do atributo:

Para mais informações, leia [Cortez e Morais, 2007].

  1. X - coordenada espacial do eixo x no mapa do parque de Montesinho: 1 a 9
  2. Y - coordenada espacial do eixo y no mapa do parque de Montesinho: 2 a 9
  3. mês - mês do ano: 'jan' a 'dez'
  4. dia - dia da semana: 'seg' a 'sol'
  5. FFMC - índice FFMC do sistema FWI: 18,7 a 96,20
  6. DMC - índice DMC do sistema FWI: 1,1 a 291,3
  7. DC - índice DC do sistema FWI: 7,9 a 860,6
  8. ISI - índice ISI do sistema FWI: 0,0 a 56,10
  9. temp - temperatura em graus Celsius: 2,2 a 33,30
  10. UR - umidade relativa em %: 15,0 a 100
  11. vento - velocidade do vento em km/h: 0,40 a 9,40
  12. chuva - chuva externa em mm/m2: 0,0 a 6,4
  13. área - a área queimada da floresta (em ha): 0,00 a 1090,84 (esta variável de saída é muito enviesada para 0,0, portanto pode fazer sentido modelar com a transformada logarítmica).
Dividir Exemplos
'train' 517
  • Estrutura de recursos :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
área tensor float32
recursos RecursosDict
características/DC tensor float32
recursos/DMC tensor float32
recursos/FFMC tensor float32
características/ISI tensor float32
características/RH tensor float32
características/X tensor uint8
características/Y tensor uint8
recursos/dia ClassLabel int64
características/mês ClassLabel int64
características/chuva tensor float32
características/temperatura tensor float32
características/vento tensor float32
  • Citação :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}