Muttaqin, Nafiah Nur (2024) Klasifikasi penyakit diabetes menggunakan metode Random Forest dan Adaboost. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
210605110127.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) |
Abstract
INDONESIA:
Diabetes termasuk penyakit kronis yang ditandai oleh kadar gula darah tinggi akibat gangguan produksi atau fungsi insulin, yang dapat menyebabkan komplikasi serius jika tidak ditangani. Klasifikasi diabetes diperlukan untuk membantu deteksi dini dan pengambilan keputusan klinis yang lebih tepat guna mencegah komplikasi jangka panjang. Penelitian ini membandingkan metode Random Forest dan Adaboost untuk meningkatkan akurasi prediksi diabetes. Dataset yang digunakan adalah data diabetes penduduk Afrika-Amerika pedesaan, yang diproses melalui interpolasi, normalisasi, dan Balancing menggunakan SMOTE. Hasil penelitian menunjukkan bahwa Random Forest memiliki performa lebih baik dengan akurasi hingga 98%, unggul dalam precision, recall, dan F1-score dibandingkan Adaboost yang mencapai akurasi 96%. Analisis feature importance mengidentifikasi kadar glukosa sebagai faktor paling signifikan, diikuti oleh fitur usia. Penelitian ini mendukung kesimpulan bahwa metode Random Forest adalah metode yang lebih efektif untuk prediksi diabetes dan pengambilan keputusan yang lebih akurat.
ENGLISH:
Diabetes is a chronic disease characterized by high blood sugar levels due to impaired insulin production or function, which can lead to serious complications if left untreated. Diabetes classification is needed to aid early detection and more informed clinical decision-making to prevent long-term complications. This research compares Random Forest and Adaboost methods to improve the accuracy of diabetes prediction. The dataset used is diabetes data of rural African-American population, which is processed through interpolation, normalization, and balancing using SMOTE. The results showed that Random Forest performed better with up to 98% accuracy, excelling in precision, recall, and F1-score compared to Adaboost which achieved 96% accuracy. Feature importance analysis identified glucose level as the most significant factor, followed by age. This research supports the conclusion that the Random Forest method is a more effective method for diabetes prediction and more accurate decision making.
ARABIC:
مرض السكري هو مرض مزمن يتميز بارتفاع مستويات السكر في الدم بسبب ضعف إنتاج الأنسولين أو وظيفته، والذي يمكن أن يؤدي إلى مضاعفات خطيرة إذا ترك دون علاج. هناك حاجة إلى تصنيف مرض السكري للمساعدة في الكشف المبكر واتخاذ قرارات سريرية أكثر ملاءمة لمنع المضاعفات طويلة الأمد. قارن هذا البحث بين طريقة غابة عشوائية و تعزيز التكيف لتحسين دقة التنبؤ بمرض السكري. كانت مجموعة البيانات المستخدمة هي بيانات مرض السكري للسكان الريفيين الأمريكيين من أصل أفريقي، والتي تمت معالجتها من خلال الاستيفاء والتطبيع والموازنة باستخدام تقنية الإفراط في أخذ عينات الأقليات الاصطناعية (SMOTE). أظهرت النتائج أن طريقة غابة عشوائية تتمتع بأداء أفضل بدقة تصل إلى 98٪، متفوقة في الدقة والاستدعاء ودرجة ف1 مقارنة بطريقة تعزيز التكيف التي تحقق دقة بنسبة 96٪. حدد تحليل ميزة الأهمية مستويات الجلوكوز على أنها العامل الأكثر أهمية، تليها ميزة العمر. يدعم هذا البحث الاستنتاج القائل بأن طريقة الغابة العشوائية هي طريقة أكثر فاعلية للتنبؤ بمرض السكري واتخاذ قرارات أكثر دقة..
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Aziz, Okta Qomaruddin and Holle, Khadijah Fahmi Hayati |
Keywords: | Adaboost; Diabetes; Klasifikasi; Random ForesT; Classification; Diabetes; Random Forest; Adaboost; تعزيز تكي; مرض سكري; تصنيف; غابة عشوائية |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Nafiah Nur Muttaqin |
Date Deposited: | 24 Dec 2024 11:45 |
Last Modified: | 24 Dec 2024 11:45 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/70970 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |