آتش سوزی جنگل

  • توضیحات :

این یک کار رگرسیونی است، که در آن هدف پیش‌بینی منطقه سوخته آتش‌سوزی‌های جنگلی، در منطقه شمال شرقی پرتغال، با استفاده از داده‌های هواشناسی و سایر داده‌ها است.

اطلاعات مجموعه داده:

در [کورتز و مورایس، 2007]، «مساحت» خروجی برای اولین بار با یک تابع ln(x+1) تبدیل شد. سپس چندین روش داده کاوی به کار گرفته شد. پس از برازش مدل ها، خروجی ها با معکوس تبدیل ln(x+1) پس پردازش شدند. چهار تنظیم ورودی مختلف استفاده شد. آزمایش ها با استفاده از 10 برابر (اعتبار متقابل) 30 اجرا شد. دو معیار رگرسیون اندازه گیری شد: MAD و RMSE. یک ماشین بردار پشتیبان گاوسی (SVM) تغذیه شده با تنها 4 شرایط آب و هوایی مستقیم (دما، RH، باد و باران) بهترین مقدار MAD را به دست آورد: 0.01 + 12.71 (میانگین و فاصله اطمینان در 95٪ با استفاده از توزیع t-student). بهترین RMSE توسط پیش بینی میانگین ساده لوح به دست آمد. تجزیه و تحلیل منحنی خطای رگرسیون (REC) نشان می دهد که مدل SVM نمونه های بیشتری را در یک خطای پذیرفته شده کمتر پیش بینی می کند. در واقع، مدل SVM آتش سوزی های کوچک بهتری را پیش بینی می کند که اکثریت هستند.

اطلاعات ویژگی:

برای اطلاعات بیشتر، [کورتز و مورایس، 2007] را بخوانید.

  1. X - مختصات فضایی محور x در نقشه پارک Montesinho: 1 تا 9
  2. مختصات فضایی محور y در نقشه پارک مونتهسینیو: 2 تا 9
  3. ماه - ماه سال: 'جان' تا 'دس'
  4. روز - روز هفته: "از دوشنبه" تا "خورشید"
  5. FFMC - شاخص FFMC از سیستم FWI: 18.7 تا 96.20
  6. DMC - شاخص DMC از سیستم FWI: 1.1 تا 291.3
  7. DC - شاخص DC از سیستم FWI: 7.9 تا 860.6
  8. ISI - شاخص ISI از سیستم FWI: 0.0 تا 56.10
  9. دما - درجه حرارت بر حسب درجه سانتیگراد: 2.2 تا 33.30
  10. RH - رطوبت نسبی در درصد: 15.0 تا 100
  11. باد - سرعت باد بر حسب کیلومتر در ساعت: 0.40 تا 9.40
  12. باران - باران بیرونی در میلی متر بر متر مربع: 0.0 تا 6.4
  13. مساحت - مساحت سوخته جنگل (در هکتار): 0.00 تا 1090.84 (این متغیر خروجی بسیار به سمت 0.0 منحرف است، بنابراین ممکن است مدل سازی با تبدیل لگاریتم منطقی باشد).
شکاف مثال ها
'train' 517
  • ساختار ویژگی :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
حوزه تانسور float32
امکانات FeaturesDict
ویژگی ها / DC تانسور float32
ویژگی ها/DMC تانسور float32
ویژگی ها/FFMC تانسور float32
ویژگی ها/ISI تانسور float32
ویژگی ها/RH تانسور float32
ویژگی ها/X تانسور uint8
ویژگی ها/Y تانسور uint8
ویژگی ها/روز ClassLabel int64
ویژگی ها / ماه ClassLabel int64
ویژگی ها/باران تانسور float32
ویژگی ها / دما تانسور float32
ویژگی ها / باد تانسور float32
  • نقل قول :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}