- Açıklama :
Bu, meteorolojik ve diğer verileri kullanarak Portekiz'in kuzeydoğu bölgesindeki orman yangınlarının yanmış alanını tahmin etmeyi amaçlayan bir regresyon görevidir.
Veri Kümesi Bilgileri:
[Cortez ve Morais, 2007]'de, çıktı 'alanı' ilk önce bir ln(x+1) işleviyle dönüştürüldü. Daha sonra çeşitli Veri Madenciliği yöntemleri uygulanmıştır. Modelleri yerleştirdikten sonra, çıktılar ln(x+1) dönüşümünün tersi ile son işleme tabi tutuldu. Dört farklı giriş kurulumu kullanıldı. Deneyler, 10 kat (çapraz doğrulama) x 30 çalıştırma kullanılarak gerçekleştirildi. İki regresyon ölçümü ölçüldü: MAD ve RMSE. Yalnızca 4 doğrudan hava koşuluyla (sıcaklık, bağıl nem, rüzgar ve yağmur) beslenen bir Gauss destek vektör makinesi (SVM) en iyi MAD değerini elde etti: 12,71 +- 0,01 (t-öğrenci dağılımı kullanılarak %95 içinde ortalama ve güven aralığı). En iyi RMSE, saf ortalama öngörücü tarafından elde edildi. Regresyon hata eğrisine (REC) yönelik bir analiz, SVM modelinin kabul edilen daha düşük bir hata dahilinde daha fazla örnek öngördüğünü gösterir. Gerçekte, SVM modeli, çoğunluğu oluşturan küçük yangınları daha iyi tahmin eder.
Öznitelik Bilgileri:
Daha fazla bilgi için [Cortez ve Morais, 2007]'yi okuyun.
- X - Montesinho park haritası içindeki x ekseni uzamsal koordinatı: 1'den 9'a
- Y - Montesinho park haritası içindeki y ekseni uzamsal koordinatı: 2 - 9
- ay - yılın ayı: 'jan' - 'dec'
- gün - haftanın günü: 'pzt' ila 'güneş'
- FFMC - FWI sisteminden FFMC dizini: 18,7 - 96,20
- DMC - FWI sisteminden DMC dizini: 1,1 ila 291,3
- DC - FWI sisteminden DC indeksi: 7,9 ila 860,6
- FWI sisteminden ISI - ISI indeksi: 0,0 ila 56,10
- temp - Santigrat derece cinsinden sıcaklık: 2,2 ila 33,30
- Bağıl Nem - % cinsinden bağıl nem: 15,0 ila 100
- rüzgar - km/sa cinsinden rüzgar hızı: 0,40 - 9,40
- yağmur - mm/m2 cinsinden dışarıdaki yağmur: 0,0 ila 6,4
- alan - ormanın yanmış alanı (ha cinsinden): 0,00 ila 1090,84 (bu çıktı değişkeni 0,0'a doğru oldukça eğimlidir, bu nedenle logaritma dönüşümü ile modellemek mantıklı olabilir).
Ana Sayfa : https://archive.ics.uci.edu/ml/datasets/Forest+Fires
Kaynak kodu :
tfds.structured.ForestFires
sürümler :
-
0.0.1
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
24.88 KiB
Veri kümesi boyutu :
162.07 KiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 517 |
- Özellik yapısı :
FeaturesDict({
'area': float32,
'features': FeaturesDict({
'DC': float32,
'DMC': float32,
'FFMC': float32,
'ISI': float32,
'RH': float32,
'X': uint8,
'Y': uint8,
'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
'rain': float32,
'temp': float32,
'wind': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
alan | tensör | şamandıra32 | ||
özellikleri | ÖzelliklerDict | |||
özellikler/DC | tensör | şamandıra32 | ||
özellikler/DMC | tensör | şamandıra32 | ||
özellikler/FFMC | tensör | şamandıra32 | ||
özellikler/ISI | tensör | şamandıra32 | ||
özellikler/sağ | tensör | şamandıra32 | ||
özellikler/X | tensör | uint8 | ||
özellikler/Y | tensör | uint8 | ||
özellikler/gün | SınıfEtiketi | int64 | ||
özellikler/ay | SınıfEtiketi | int64 | ||
özellikler/yağmur | tensör | şamandıra32 | ||
özellikler/sıcaklık | tensör | şamandıra32 | ||
özellikler/rüzgar | tensör | şamandıra32 |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):('area', 'features')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }
@article{cortez2007data,
title={A data mining approach to predict forest fires using meteorological data},
author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
year={2007},
publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}