kebakaran hutan

  • Deskripsi :

Ini adalah tugas regresi, di mana tujuannya adalah untuk memprediksi luas kebakaran hutan yang terbakar, di wilayah timur laut Portugal, dengan menggunakan data meteorologi dan lainnya.

Informasi Kumpulan Data:

Dalam [Cortez dan Morais, 2007], output 'area' pertama kali diubah dengan fungsi ln(x+1). Kemudian, beberapa metode Data Mining diterapkan. Setelah menyesuaikan model, output diproses dengan kebalikan dari transformasi ln(x+1). Empat pengaturan input yang berbeda digunakan. Eksperimen dilakukan dengan menggunakan 10 kali lipat (validasi silang) x 30 kali. Dua metrik regresi diukur: MAD dan RMSE. Mesin vektor dukungan Gaussian (SVM) yang diberi makan hanya dengan 4 kondisi cuaca langsung (suhu, RH, angin dan hujan) memperoleh nilai MAD terbaik: 12,71 + - 0,01 (rata-rata dan interval kepercayaan dalam 95% menggunakan distribusi t-student). RMSE terbaik dicapai oleh prediktor rata-rata naif. Analisis terhadap kurva kesalahan regresi (REC) menunjukkan bahwa model SVM memprediksi lebih banyak contoh dalam kesalahan yang diakui lebih rendah. Akibatnya, model SVM memprediksi kebakaran kecil yang lebih baik, yang merupakan mayoritas.

Informasi Atribut:

Untuk informasi lebih lanjut, baca [Cortez dan Morais, 2007].

  1. X - koordinat spasial sumbu x dalam peta taman Montesinho: 1 hingga 9
  2. Y - koordinat spasial sumbu y dalam peta taman Montesinho: 2 hingga 9
  3. bulan - bulan dalam setahun: 'jan' to 'dec'
  4. hari - hari dalam seminggu: 'mon' to 'sun'
  5. FFMC - indeks FFMC dari sistem FWI: 18,7 hingga 96,20
  6. DMC - indeks DMC dari sistem FWI: 1.1 hingga 291.3
  7. Indeks DC - DC dari sistem FWI: 7,9 hingga 860,6
  8. Indeks ISI - ISI dari sistem FWI: 0,0 hingga 56,10
  9. temp - suhu dalam derajat Celcius: 2,2 hingga 33,30
  10. RH - kelembapan relatif dalam %: 15,0 hingga 100
  11. angin - kecepatan angin dalam km/jam: 0,40 hingga 9,40
  12. hujan - hujan di luar dalam mm/m2 : 0,0 hingga 6,4
  13. luas - luas hutan yang terbakar (dalam ha): 0,00 hingga 1090,84 (variabel keluaran ini sangat condong ke arah 0,0, sehingga masuk akal untuk membuat model dengan transformasi logaritma).
Membelah Contoh
'train' 517
  • Struktur fitur :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
daerah Tensor float32
fitur fiturDict
fitur/ DC Tensor float32
fitur/DMC Tensor float32
fitur/FFMC Tensor float32
fitur/ISI Tensor float32
fitur/RH Tensor float32
fitur/X Tensor uint8
fitur/Y Tensor uint8
fitur/hari LabelKelas int64
fitur/bulan LabelKelas int64
fitur/hujan Tensor float32
fitur/temp Tensor float32
fitur/angin Tensor float32
  • Kutipan :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}