जंगल की आग

  • विवरण :

यह एक प्रतिगमन कार्य है, जहां उद्देश्य मौसम विज्ञान और अन्य डेटा का उपयोग करके पुर्तगाल के पूर्वोत्तर क्षेत्र में जंगल की आग के जले हुए क्षेत्र की भविष्यवाणी करना है।

डेटा सेट जानकारी:

[कॉर्टेज़ और मोराइस, 2007] में, आउटपुट 'क्षेत्र' को पहली बार एक ln(x+1) फ़ंक्शन के साथ रूपांतरित किया गया था। फिर, कई डाटा माइनिंग विधियों को लागू किया गया। मॉडलों को फ़िट करने के बाद, आउटपुट को ln(x+1) रूपांतरण के व्युत्क्रम के साथ पोस्ट-प्रोसेस किया गया। चार अलग-अलग इनपुट सेटअप का उपयोग किया गया था। प्रयोग 10 गुना (क्रॉस-वैलिडेशन) x 30 रन का उपयोग करके किए गए थे। दो प्रतिगमन मेट्रिक्स मापा गया: एमएडी और आरएमएसई। केवल 4 प्रत्यक्ष मौसम स्थितियों (अस्थायी, आरएच, हवा और बारिश) के साथ खिलाए गए गॉसियन समर्थन वेक्टर मशीन (एसवीएम) ने सर्वश्रेष्ठ एमएडी मूल्य प्राप्त किया: 12.71 + - 0.01 (टी-छात्र वितरण का उपयोग करके 95% के भीतर माध्य और विश्वास अंतराल)। सबसे अच्छा आरएमएसई भोले-भाले भविष्यवक्ता द्वारा प्राप्त किया गया था। प्रतिगमन त्रुटि वक्र (आरईसी) के विश्लेषण से पता चलता है कि एसवीएम मॉडल कम स्वीकृत त्रुटि के भीतर अधिक उदाहरणों की भविष्यवाणी करता है। वास्तव में, एसवीएम मॉडल बेहतर छोटी आग की भविष्यवाणी करता है, जो बहुसंख्यक हैं।

विशेषता जानकारी:

अधिक जानकारी के लिए [कॉर्टेज़ और मोरिस, 2007] पढ़ें।

  1. मॉन्टेसिन्हो पार्क मानचित्र के भीतर एक्स - एक्स-अक्ष स्थानिक समन्वय: 1 से 9
  2. मॉन्टेसिन्हो पार्क मानचित्र के भीतर वाई-वाई-अक्ष स्थानिक समन्वय: 2 से 9
  3. माह - वर्ष का महीना: 'जन' से 'दिसंबर'
  4. दिन - सप्ताह का दिन: 'सोम' से 'सूर्य'
  5. FFMC - FWI सिस्टम से FFMC इंडेक्स: 18.7 से 96.20
  6. DMC - FWI सिस्टम से DMC इंडेक्स: 1.1 से 291.3
  7. FWI सिस्टम से DC - DC इंडेक्स: 7.9 से 860.6
  8. ISI - FWI सिस्टम से ISI इंडेक्स: 0.0 से 56.10
  9. तापमान - सेल्सियस डिग्री में तापमान: 2.2 से 33.30
  10. आरएच - सापेक्षिक आर्द्रता %: 15.0 से 100 में
  11. हवा - किमी/घंटा में हवा की गति: 0.40 से 9.40
  12. बारिश - बाहर की बारिश मिमी/मी2 में: 0.0 से 6.4
  13. क्षेत्र - जंगल का जला हुआ क्षेत्र (हेक्टेयर में): 0.00 से 1090.84 (यह आउटपुट चर 0.0 की ओर बहुत तिरछा है, इस प्रकार यह लघुगणक परिवर्तन के साथ मॉडल के लिए समझ में आ सकता है)।
विभाजित करना उदाहरण
'train' 517
  • फ़ीचर संरचना :
FeaturesDict({
    'area': float32,
    'features': FeaturesDict({
        'DC': float32,
        'DMC': float32,
        'FFMC': float32,
        'ISI': float32,
        'RH': float32,
        'X': uint8,
        'Y': uint8,
        'day': ClassLabel(shape=(), dtype=int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=int64, num_classes=12),
        'rain': float32,
        'temp': float32,
        'wind': float32,
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
क्षेत्र टेन्सर फ्लोट32
विशेषताएँ विशेषताएं डिक्ट
विशेषताएं/डीसी टेन्सर फ्लोट32
विशेषताएं/डीएमसी टेन्सर फ्लोट32
सुविधाएँ / एफएफएमसी टेन्सर फ्लोट32
सुविधाएँ/आईएसआई टेन्सर फ्लोट32
सुविधाएँ / आरएच टेन्सर फ्लोट32
फीचर/एक्स टेन्सर uint8
फीचर्स/वाई टेन्सर uint8
सुविधाएँ / दिन क्लासलेबल int64
सुविधाएँ / महीना क्लासलेबल int64
सुविधाएँ / बारिश टेन्सर फ्लोट32
सुविधाएँ / अस्थायी टेन्सर फ्लोट32
सुविधाएँ / हवा टेन्सर फ्लोट32
  • उद्धरण :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}