Pożary lasów

  • opis :

Jest to zadanie regresyjne, którego celem jest przewidywanie spalonego obszaru pożarów lasów w północno-wschodnim regionie Portugalii za pomocą danych meteorologicznych i innych.

Informacje o zestawie danych:

W pracy [Cortez i Morais, 2007] wyjściowy „obszar” został najpierw przekształcony za pomocą funkcji ln(x+1). Następnie zastosowano kilka metod Data Mining. Po dopasowaniu modeli, wyniki zostały poddane post-processingowi z odwrotnością transformacji ln(x+1). Zastosowano cztery różne konfiguracje wejść. Eksperymenty przeprowadzono stosując 10-krotne (walidacja krzyżowa) x 30 przebiegów. Zmierzono dwa wskaźniki regresji: MAD i RMSE. Maszyna wektorów nośnych Gaussa (SVM) zasilana tylko 4 bezpośrednimi warunkami pogodowymi (temperatura, wilgotność względna, wiatr i deszcz) uzyskała najlepszą wartość MAD: 12,71 ± 0,01 (średnia i przedział ufności w granicach 95% przy użyciu rozkładu t-studenta). Najlepszy RMSE został osiągnięty przez naiwny predyktor średniej. Analiza krzywej błędu regresji (REC) pokazuje, że model SVM przewiduje więcej przykładów przy niższym dopuszczalnym błędzie. W efekcie model SVM lepiej przewiduje małe pożary, które stanowią większość.

Informacje o atrybucie:

Aby uzyskać więcej informacji, przeczytaj [Cortez i Morais, 2007].

  1. X - współrzędna przestrzenna osi X na mapie parku Montesinho: od 1 do 9
  2. Y - współrzędna przestrzenna osi y na mapie parku Montesinho: od 2 do 9
  3. miesiąc - miesiąc w roku: 'jan' do 'dec'
  4. dzień - dzień tygodnia: 'pon' do 'sun'
  5. FFMC - wskaźnik FFMC z systemu FWI: 18,7 do 96,20
  6. DMC - indeks DMC z systemu FWI: od 1,1 do 291,3
  7. DC - indeks DC z systemu FWI: 7,9 do 860,6
  8. ISI - indeks ISI z systemu FWI: od 0,0 do 56,10
  9. temp - temperatura w stopniach Celsjusza: od 2,2 do 33,30
  10. RH - wilgotność względna w %: od 15,0 do 100
  11. wiatr - prędkość wiatru w km/h: 0,40 do 9,40
  12. deszcz - deszcz na zewnątrz w mm/m2 : 0,0 do 6,4
  13. area - powierzchnia spalonego lasu (w ha): od 0,00 do 1090,84 (ta zmienna wyjściowa jest bardzo pochylona w kierunku 0,0, dlatego sensowne może być modelowanie z transformacją logarytmiczną).
Rozdzielać Przykłady
'train' 517
  • Struktura funkcji :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
powierzchnia Napinacz pływak32
cechy FunkcjeDict
funkcje/DC Napinacz pływak32
funkcje/DMC Napinacz pływak32
funkcje/FFMC Napinacz pływak32
funkcje/ISI Napinacz pływak32
funkcje/RH Napinacz pływak32
funkcje/X Napinacz uint8
cechy/Y Napinacz uint8
funkcje/dzień Etykieta klasy int64
funkcje/miesiąc Etykieta klasy int64
cechy/deszcz Napinacz pływak32
cechy/temp Napinacz pływak32
cechy/wiatr Napinacz pływak32
  • Cytat :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}