Cháy rừng

  • Mô tả:

Đây là một nhiệm vụ hồi quy, trong đó mục đích là dự đoán khu vực cháy rừng bị thiêu rụi, ở khu vực đông bắc của Bồ Đào Nha, bằng cách sử dụng dữ liệu khí tượng và các dữ liệu khác.

Thông tin Tập dữ liệu:

Trong [Cortez và Morais, 2007], 'vùng' đầu ra lần đầu tiên được biến đổi với hàm ln (x + 1). Sau đó, một số phương pháp Khai thác dữ liệu đã được áp dụng. Sau khi phù hợp với các mô hình, kết quả đầu ra được xử lý sau với nghịch đảo của phép biến đổi ln (x + 1). Bốn thiết lập đầu vào khác nhau đã được sử dụng. Các thí nghiệm được thực hiện bằng cách sử dụng 10 lần (xác nhận chéo) x 30 lần chạy. Hai chỉ số hồi quy được đo lường: MAD và RMSE. Một máy vectơ hỗ trợ Gaussian (SVM) chỉ sử dụng 4 điều kiện thời tiết trực tiếp (nhiệt độ, RH, gió và mưa) đã thu được giá trị MAD tốt nhất: 12,71 + - 0,01 (trung bình và khoảng tin cậy trong khoảng 95% sử dụng phân phối t-student). RMSE tốt nhất đã đạt được nhờ công cụ dự đoán trung bình ngây thơ. Phân tích đường cong lỗi hồi quy (REC) cho thấy rằng mô hình SVM dự đoán nhiều ví dụ hơn trong phạm vi sai số được thừa nhận thấp hơn. Trên thực tế, mô hình SVM dự đoán các đám cháy nhỏ tốt hơn, chiếm đa số.

Thông tin thuộc tính:

Để biết thêm thông tin, hãy đọc [Cortez và Morais, 2007].

  1. X - tọa độ không gian trục x trong bản đồ công viên Montesinho: 1 đến 9
  2. Y - tọa độ không gian trục y trong bản đồ công viên Montesinho: 2 đến 9
  3. tháng - tháng trong năm: 'jan' thành 'dec'
  4. ngày - ngày trong tuần: 'mon' thành 'sun'
  5. FFMC - Chỉ số FFMC từ hệ thống FWI: 18,7 đến 96,20
  6. DMC - Chỉ số DMC từ hệ thống FWI: 1,1 đến 291,3
  7. Chỉ số DC - DC từ hệ thống FWI: 7,9 đến 860,6
  8. ISI - Chỉ số ISI từ hệ thống FWI: 0,0 đến 56,10
  9. temp - nhiệt độ tính bằng độ C: 2,2 đến 33,30
  10. RH - độ ẩm tương đối tính bằng%: 15,0 đến 100
  11. gió - tốc độ gió tính bằng km / h: 0,40 đến 9,40
  12. mưa - mưa bên ngoài tính bằng mm / m2: 0,0 đến 6,4
  13. diện tích - diện tích rừng bị cháy (tính bằng ha): 0,00 đến 1090,84 (biến sản lượng này rất lệch về phía 0,0, do đó có thể có ý nghĩa khi lập mô hình bằng phép biến đổi logarit).
Tách ra Các ví dụ
'train' 517
  • Các tính năng:
FeaturesDict({
    'area': tf.float32,
    'features': FeaturesDict({
        'DC': tf.float32,
        'DMC': tf.float32,
        'FFMC': tf.float32,
        'ISI': tf.float32,
        'RH': tf.float32,
        'X': tf.uint8,
        'Y': tf.uint8,
        'day': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
        'month': ClassLabel(shape=(), dtype=tf.int64, num_classes=12),
        'rain': tf.float32,
        'temp': tf.float32,
        'wind': tf.float32,
    }),
})
  • Trích dẫn:
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = "2017",
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and Computer Sciences" }

@article{cortez2007data,
  title={A data mining approach to predict forest fires using meteorological data},
  author={Cortez, Paulo and Morais, Anibal de Jesus Raimundo},
  year={2007},
  publisher={Associa{\c{c} }{\~a}o Portuguesa para a Intelig{\^e}ncia Artificial (APPIA)}
}