Khassogi, Abdurrahman Wahid (2025) Klasifikasi curah hujan menggunakan algoritma decision tree c4.5. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
18650070.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (2MB) |
Abstract
INDONESIA:
Penelitian ini dilatarbelakangi oleh pentingnya informasi curah hujan dalam mendukung pengambilan keputusan di berbagai sektor, khususnya di bidang pertanian, infrastruktur, dan mitigasi bencana. Permasalahan utama yang diangkat adalah bagaimana menerapkan algoritma Decision Tree C4.5 untuk mengklasifikasikan curah hujan berdasarkan data historis cuaca. Tujuan dari penelitian ini adalah untuk mengetahui hasil dan tingkat akurasi klasifikasi curah hujan menggunakan algoritma C4.5. Penelitian dilakukan dengan pendekatan kuantitatif, dimulai dari pengumpulan data cuaca harian Kabupaten Bogor dari BMKG, dilanjutkan dengan proses preprocessing data, pemilihan fitur, pelatihan model klasifikasi menggunakan algoritma C4.5, serta evaluasi performa model menggunakan metrik evaluasi seperti akurasi, precision, recall, dan F1-score. Pengujian dilakukan dalam lima skenario pembagian data latih dan data uji (90:10 hingga 50:50) untuk mengukur konsistensi kinerja model. Hasil penelitian menunjukkan bahwa skenario dengan rasio 90:10 memberikan akurasi tertinggi sebesar 77%. Fitur seperti suhu rata-rata, lama penyinaran matahari, dan kecepatan angin rata-rata merupakan variabel yang paling berpengaruh dalam klasifikasi. Berdasarkan hasil tersebut, algoritma C4.5 dapat dijadikan solusi yang efektif dalam membangun sistem klasifikasi curah hujan berbasis data historis cuaca.
ENGLISH:
This research is motivated by the importance of rainfall information in supporting decision making in various sectors, especially in agriculture, infrastructure, and disaster mitigation. The main problem raised is how to apply the Decision Tree C4.5 algorithm to classify rainfall based on historical weather data. The purpose of this study is to determine the results and accuracy level of rainfall classification using the C4.5 algorithm. The research was conducted with a quantitative approach, starting from collecting daily weather data of Bogor Regency from BMKG, followed by data preprocessing, feature selection, classification model training using C4.5 algorithm, and model performance evaluation using evaluation metrics such as accuracy, precision, recall, and F1-score. Tests were conducted in five scenarios of training and test data distribution (90:10 to 50:50) to measure the consistency of model performance. The results showed that the scenario with a 90:10 ratio gave the highest accuracy of 77%. Features such as average temperature, sunshine duration, and average wind speed were the most influential variables in the classification. Based on these results, the C4.5 algorithm can be used as an effective solution in building a rainfall classification system based on historical weather data.
ARABIC:
تأتي هذه الدراسة في إطار أهمية المعلومات عن هطول الأمطار في دعم اتخاذ القرار في مختلف القطاعات، خاصة في مجالات الزراعة والبنية التحتية والتخفيف من الكوارث. المشكلة الرئيسية التي تطرحها هذه الدراسة هي كيفية تطبيق خوارزمية شجرة القرار 4.5C لتصنيف هطول الأمطار بناءً على بيانات الطقس التاريخية. تهدف هذه الدراسة إلى معرفة نتائج ومستوى دقة تصنيف هطول الأمطار باستخدام خوارزمية 4.5C.أجريت الدراسة باستخدام المنهج الكمي، بدءًا من جمع بيانات الطقس اليومية لمقاطعة بوجور من الهيئة العامة للأرصاد الجوية، ثم عملية المعالجة المسبقة للبيانات، واختيار الميزات، وتدريب نموذج التصنيف باستخدام خوارزمية 4.5C، وتقييم أداء النموذج باستخدام مقاييس التقييم مثل الدقة والضبط والاسترجاع و F1-score. تم تنفيذ عملية التدريب والاختبار في خمسة سيناريوهات مختلفة لتقسيم البيانات، وهي ٩٠٪ للتدريب و١٠٪ للاختبار، ٨٠٪ للتدريب و٢٠٪ للاختبار، ٧٠٪ للتدريب و٣٠٪ للاختبار، ٦٠٪ للتدريب و٤٠٪ للاختبار، و٥٠٪ للتدريب و٥٠٪ للاختبار.أظهرت النتائج أن السيناريو بنسبة ٩٠٪ للتدريب و١٠٪ للاختبار أعطى أعلى دقة بنسبة ٧٧٪. كانت الميزات مثل متوسط درجة الحرارة ومدة سطوع الشمس ومتوسط سرعة الرياح هي المتغيرات الأكثر تأثيرًا في التصنيف. بناءً على هذه النتائج، يمكن اعتبار خوارزمية 4.5C حلاً فعالاً في بناء نظام تصنيف
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Abidin, Zainal and Lestari, Tri Mukti |
Keywords: | curah hujan; decision tree; algoritma c4.5; klasifikasi; evaluasi model Rainfall; Decision Tree; C4.5 Algorithm; Classification; Model Evaluation. هطول األمطار;شجرة القرار; خوارزمية4.5C; التصنيف; تقييم النموذج. |
Subjects: | 17 PSYCHOLOGY AND COGNITIVE SCIENCES > 1702 Cognitive Sciences > 170203 Knowledge Representation and Machine Learning |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Abdurrahman Wahid Khassogi |
Date Deposited: | 17 Sep 2025 09:34 |
Last Modified: | 17 Sep 2025 09:34 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/79625 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |