- توضیحات :
این یک کار رگرسیونی است، که در آن هدف پیشبینی منطقه سوخته آتشسوزیهای جنگلی، در منطقه شمال شرقی پرتغال، با استفاده از دادههای هواشناسی و سایر دادهها است.
اطلاعات مجموعه داده:
در [کورتز و مورایس، 2007]، «مساحت» خروجی برای اولین بار با یک تابع ln(x+1) تبدیل شد. سپس چندین روش داده کاوی به کار گرفته شد. پس از برازش مدل ها، خروجی ها با معکوس تبدیل ln(x+1) پس پردازش شدند. چهار تنظیم ورودی مختلف استفاده شد. آزمایش ها با استفاده از 10 برابر (اعتبار متقابل) 30 اجرا شد. دو معیار رگرسیون اندازه گیری شد: MAD و RMSE. یک ماشین بردار پشتیبان گاوسی (SVM) تغذیه شده با تنها 4 شرایط آب و هوایی مستقیم (دما، RH، باد و باران) بهترین مقدار MAD را به دست آورد: 0.01 + 12.71 (میانگین و فاصله اطمینان در 95٪ با استفاده از توزیع t-student). بهترین RMSE توسط پیش بینی میانگین ساده لوح به دست آمد. تجزیه و تحلیل منحنی خطای رگرسیون (REC) نشان می دهد که مدل SVM نمونه های بیشتری را در یک خطای پذیرفته شده کمتر پیش بینی می کند. در واقع، مدل SVM آتش سوزی های کوچک بهتری را پیش بینی می کند که اکثریت هستند.
اطلاعات ویژگی:
برای اطلاعات بیشتر، [کورتز و مورایس، 2007] را بخوانید.
- X - مختصات فضایی محور x در نقشه پارک Montesinho: 1 تا 9
- مختصات فضایی محور y در نقشه پارک مونتهسینیو: 2 تا 9
- ماه - ماه سال: 'جان' تا 'دس'
- روز - روز هفته: "از دوشنبه" تا "خورشید"
- FFMC - شاخص FFMC از سیستم FWI: 18.7 تا 96.20
- DMC - شاخص DMC از سیستم FWI: 1.1 تا 291.3
- DC - شاخص DC از سیستم FWI: 7.9 تا 860.6
- ISI - شاخص ISI از سیستم FWI: 0.0 تا 56.10
- دما - درجه حرارت بر حسب درجه سانتیگراد: 2.2 تا 33.30
- RH - رطوبت نسبی در درصد: 15.0 تا 100
- باد - سرعت باد بر حسب کیلومتر در ساعت: 0.40 تا 9.40
- باران - باران بیرونی در میلی متر بر متر مربع: 0.0 تا 6.4
- مساحت - مساحت سوخته جنگل (در هکتار): 0.00 تا 1090.84 (این متغیر خروجی بسیار به سمت 0.0 منحرف است، بنابراین ممکن است مدل سازی با تبدیل لگاریتم منطقی باشد).
صفحه اصلی : https://archive.ics.uci.edu/ml/datasets/Forest+Fires
کد منبع :
tfds.structured.ForestFires
نسخه ها :
-
0.0.1
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
24.88 KiB
اندازه مجموعه داده :
162.07 KiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 517 |
- ساختار ویژگی :
FeaturesDict({
'area': float32,
'features': FeaturesDict({
'DC': float32,
'DMC': float32,
'FFMC': float32,
'ISI': float32,
'RH': float32,
'X': uint8,
'Y': uint8,
'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
'rain': float32,
'temp': float32,
'wind': float32,
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
حوزه | تانسور | float32 | ||
امکانات | FeaturesDict | |||
ویژگی ها / DC | تانسور | float32 | ||
ویژگی ها/DMC | تانسور | float32 | ||
ویژگی ها/FFMC | تانسور | float32 | ||
ویژگی ها/ISI | تانسور | float32 | ||
ویژگی ها/RH | تانسور | float32 | ||
ویژگی ها/X | تانسور | uint8 | ||
ویژگی ها/Y | تانسور | uint8 | ||
ویژگی ها/روز | ClassLabel | int64 | ||
ویژگی ها / ماه | ClassLabel | int64 | ||
ویژگی ها/باران | تانسور | float32 | ||
ویژگی ها / دما | تانسور | float32 | ||
ویژگی ها / باد | تانسور | float32 |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('area', 'features')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }
@article{cortez2007data,
title={A data mining approach to predict forest fires using meteorological data},
author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
year={2007},
publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}