Implementasi metode Random Forest untuk klasifikasi musim di Indonesia berbasis data klimatologi

Husna, Faiza Arifatul (2026) Implementasi metode Random Forest untuk klasifikasi musim di Indonesia berbasis data klimatologi. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

Text (Fulltext)
220605110001.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.
(1MB)

Abstract

INDONESIA:

Penelitian ini dilakukan untuk mengatasi permasalahan dalam klasifikasi musim yang berperan penting dalam mitigasi bencana alam. Tujuan penelitian ini adalah menerapkan metode Random Forest untuk mengklasifikasikan musim berdasarkan data klimatologi. Metode yang digunakan meliputi preprocessing data, pelatihan model, serta evaluasi melalui pengujian hyperparameter (n_estimator), missing value, dan outlier untuk mengetahui pengaruhnya terhadap kinerja model. Metode penelitian meliputi tahapan preprocessing data, pelatihan model, dan evaluasi kinerja. Pelatihan model menggunakan algoritma Random Forest dengan variasi hyperparameter n_estimators sebanyak 10 hingga 60 dengan rasio pembagian data 60:40, 70:30, 80:20, 90:10. Hasil penelitian menunjukkan bahwa model Random Forest mampu menghasilkan akurasi tertinggi sebesar 0.9 pada n_estimators = 20 rasio 60:40. Selain itu, peningkatan jumlah missing value menyebabkan penurunan akurasi. Keberadaan outlier juga terbukti memengaruhi performa model dengan penurunan akurasi rata-rata sebesar 5–10%. Variasi hyperparameter menunjukkan bahwa perubahan jumlah pohon tidak selalu memberikan peningkatan signifikan terhadap kinerja model. Dengan demikian, penelitian ini diharapkan dapat memberikan kontribusi dalam pengembangan sistem klasifikasi musim yang lebih akurat, sehingga dapat dimanfaatkan sebagai dasar dalam perencanaan mitigasi bencana alam secara lebih efektif dan tepat waktu.

ENGLISH:

This study was conducted to address challenges in seasonal classification, which plays a crucial role in natural disaster mitigation. The objective of this study is to apply the Random Forest method to classify seasons based on climatological data. The methods employed include data preprocessing, model training, and evaluation through testing of hyperparameters (n_estimators), missing values, and outliers to determine their impact on model performance. The research methodology includes the stages of data preprocessing, model training, and performance evaluation. Model training utilized the Random Forest algorithm with hyperparameter variations for n_estimators ranging from 10 to 60, using data split ratios of 60:40, 70:30, 80:20, and 90:10. The results show that the Random Forest model achieves the highest accuracy of 0.9 at n_estimators = 20 with a 60:40 split. Additionally, an increase in the number of missing values leads to a decrease in accuracy. The presence of outliers was also found to affect model performance, resulting in an average accuracy decrease of 5–10%. Hyperparameter variations indicated that changing the number of trees does not always significantly improve model performance. Thus, this study is expected to contribute to the development of a more accurate seasonal classification system, which can serve as a basis for more effective and timely natural disaster mitigation planning.

ARABIC:

أُجريت هذه الدراسة لمعالجة المشكلات المتعلقة بتصنيف الفصول، والتي تلعب دوراً مهماً في التخفيف من آثار الكوارث الطبيعية. ويهدف هذا البحث إلى تطبيق طريقة «راندوم فورست» (Random Forest) لتصنيف الفصول استناداً إلى البيانات المناخية. وتشمل الطرق المستخدمة معالجة البيانات مسبقاً، وتدريب النموذج، والتقييم من خلال اختبار المعلمات الفائقة (n_estimator)، والقيم المفقودة، والقيم المتطرفة لمعرفة تأثيرها على أداء النموذج. تشمل منهجية البحث مراحل المعالجة المسبقة للبيانات، وتدريب النموذج، وتقييم الأداء. تم تدريب النموذج باستخدام خوارزمية Random Forest مع تباين في المعلمات الفائقة n_estimators من 10 إلى 60 مع نسب تقسيم البيانات 60:40، 70:30، 80:20، 90:10. أظهرت نتائج البحث أن نموذج Random Forest قادر على تحقيق أعلى دقة تبلغ 0.9 عند n_estimators = 20 ونسبة 60:40. بالإضافة إلى ذلك، يؤدي زيادة عدد القيم المفقودة إلى انخفاض الدقة. كما ثبت أن وجود القيم المتطرفة يؤثر على أداء النموذج بانخفاض متوسط الدقة بنسبة % 5–10. أظهرت تباينات المعلمات الفائقة أن تغيير عدد الأشجار لا يؤدي دائمًا إلى تحسن كبير في أداء النموذج. وبالتالي، من المتوقع أن تسهم هذه الدراسة في تطوير نظام تصنيف للمواسم أكثر دقة، بحيث يمكن الاستفادة منه كأساس لتخطيط التخفيف من آثار الكوارث الطبيعية بشكل أكثر فعالية وفي الوقت المناسب.

Item Type:	Thesis (Undergraduate)
Supervisor:	Almais, Agung Teguh Wibowo and Chamidy, Totok
Keywords:	Klasifikasi; Data Klimatologi; Random Forest; BMKG; Musim di Indonesia; Classification; Climatological Data; Seasons in Indonesia; .التصنيف; البيانات المناخية ;غابة العشوائية; الفصول في إندونيسيا
Subjects:	08 INFORMATION AND COMPUTING SCIENCES > 0806 Information Systems > 080603 Conceptual Modelling
Departement:	Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User:	Faiza Arifatul Husna
Date Deposited:	03 Jun 2026 13:30
Last Modified:	03 Jun 2026 13:30
URI:	http://etheses.uin-malang.ac.id/id/eprint/84938

Downloads

Downloads per month over past year

Actions (login required)

View Item

Link Terkait

Media Sosial

Alamat

Gedung Abdurrahman Wahid

Jl. Gajayana No.50, Dinoyo, Lowokwaru, Malang,

Jawa Timur 65149, Indonesia

Email: csc@uin-malang.ac.id