Responsive Banner

Analisis performa metode Random Forest dan Catboost dalam pemodelan kualitas udara Kota Palembang

Kadir, Nurchaerani (2024) Analisis performa metode Random Forest dan Catboost dalam pemodelan kualitas udara Kota Palembang. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
220605210018.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (3MB) | Preview

Abstract

ABSTRAK

Polusi udara telah menjadi salah satu tantangan lingkungan terbesar yang dihadapi oleh banyak kota di seluruh dunia, mengancam kesehatan warga dan kelestarian lingkungan. Pemodelan kualitas udara yang akurat menjadi sangat penting dalam upaya mitigasi polusi udara di wilayah perkotaan, khususnya Kota Palembang. Penelitian ini berfokus pada membandingkan performa dua metode machine learning populer, yaitu Random Forest dan CatBoost dalam pemodelan kualitas udara di Kota Palembang. Data yang digunakan meliputi konsentrasi polutan udara seperti PM2.5, PM10, SO2, NO2, CO, dan O3, serta data meteorologi seperti temperature, humadity, wind speed, wind gust, dan wind direction. Kedua metode diimplementasikan dengan optimasi parameter untuk membangun model prediksi. Evaluasi model dilakukan menggunakan metrik akurasi dan Root Mean Squared Error (RMSE). Hasil menunjukkan bahwa CatBoost memiliki performa sedikit lebih baik dibandingkan Random Forest, dengan akurasi yang lebih tinggi mencapai 96.28% berbanding 94,88% untuk Random Forest, serta RMSE yang lebih rendah yaitu 0.56348 berbanding 0.66199 untuk Random Forest. Meskipun demikian, perbedaan performa tidak terlalu signifikan, dan keduanya menunjukkan performa yang cukup baik secara keseluruhan.

مستخلص البحث

تعتبر تلوث الهواء أصبح أحد أكبر التحديات البيئية التي تواجهها العديد من المدن في جميع أنحاء العالم، مهدداً صحة السكان واستدامة البيئة. يصبح نمذجة التنبؤ بجودة الهواء بدقة أمرًا بالغ الأهمية في جهود التخفيف من تلوث الهواء في المناطق الحضرية، خاصة في مدينة باليمبانغ. يركز هذا البحث على مقارنة أداء اثنتين من طرق تعلم الآلة الشائعة، وهما الغابة العشوائية و CatBoost في نمذجة التنبؤ بجودة الهواء في مدينة باليمبانغ. البيانات المستخدمة تشمل تركيز الملوثات الهوائية مثل PM2.5، PM10، SO2، NO2، CO، و O3، بالإضافة إلى البيانات الأرصادية مثل درجة الحرارة، الرطوبة، سرعة الرياح، عاصفة الرياح، واتجاه الرياح. تم تنفيذ الطريقتين مع تحسين المعايير لبناء نموذج التنبؤ. تم تقييم النموذج باستخدام مقياس الدقة وجذر متوسط مربع الخطأ (RMSE). أظهرت النتائج أن CatBoost تمتلك أداءً أفضل قليلاً مقارنة بالغابة العشوائية، مع دقة أعلى تصل إلى 96.28% مقارنةً بـ 94.88% للغابة العشوائية، وجذر متوسط مربع الخطأ أقل وهو 0.56348 مقارنةً بـ 0.66199 للغابة العشوائية. ومع ذلك، فإن الفرق في الأداء ليس كبيرًا جدًا، وكلاهما يظهر أداءً جيدًا بشكل عام.

ABSTRACT

Air pollution has become one of the biggest environmental challenges faced by many cities around the world, threatening citizens' health and environmental sustainability. Accurate modeling of air quality predictions has become crucial in efforts to mitigate air pollution in urban areas, especially in Palembang City. The study focuses on comparing the performance of two popular machine learning methods, Random Forest and CatBoost, in modeling air quality forecasts in Palembang City. The data used included concentrations of air pollutants such as PM2.5, PM10, SO2, NO2, CO, and O3, as well as meteorological data such as temperature, humidity, wind speed, wind gust, and wind direction. Both methods are implemented with parameter optimization to build predictive models. The evaluation of the model was done using accuracy metrics and root mean squared error (RMSE). The results showed that CatBoost performed slightly better than Random Forest, with a higher precision of 96.28% versus 94,88% for Random forest, and a lower RMSE of 0.56348 compared to 0.66199 for random forest. Nevertheless, the performance differences are not very significant, and both indicate fairly good overall performance.

Item Type: Thesis (Masters)
Supervisor: Faisal, Muhammad and Kurniawan, Fachrul
Keywords: Kualitas udara, Random Forest, CatBoost Random Forest، CatBoost,جودة الهواء Air Quality, Random Forest, CatBoost
Departement: Fakultas Sains dan Teknologi > Jurusan Magister Tehnik Informatika
Depositing User: Nurchaerani Kadir
Date Deposited: 02 Jul 2024 14:04
Last Modified: 02 Jul 2024 14:04
URI: http://etheses.uin-malang.ac.id/id/eprint/65583

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item