Fitriyah, Aisyah Nur (2025) Klasifikasi penyakit Alzheimer menggunakan metode XGBoost. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
220605110033_AISYAH NUR FITRIYAH.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (3MB) |
Abstract
INDONESIA:
Penyakit Alzheimer merupakan gangguan neurodegeneratif progresif yang memerlukan deteksi dini untuk memaksimalkan efektivitas penanganan medis. Penelitian ini bertujuan untuk membangun model klasifikasi penyakit Alzheimer yang akurat menggunakan algoritma Extreme Gradient Boosting (XGBoost) serta menganalisis pengaruh teknik preprocessing data terhadap performa model. Dataset yang digunakan terdiri dari 2.149 data pasien dengan 35 fitur klinis. Penelitian ini menerapkan seleksi fitur berbasis korelasi pearson, penanganan ketidakseimbangan data menggunakan ADASYN (Adaptive Synthetic Sampling), serta optimasi hyperparameter menggunakan Bayesian Optimization. Validasi model dilakukan secara menyeluruh menggunakan metode 5-Fold Cross Validation untuk menguji konsistensi performa. Hasil penelitian menunjukkan bahwa model XGBoost mampu memberikan performa klasifikasi yang sangat baik. Capaian terbaik diperoleh pada skenario 10, yaitu tanpa balancing dengan rasio pembagian data 60:40 dan seleksi fitur threshold 0.15, yang menghasilkan akurasi pengujian sebesar 95.58%, presisi 94.63%, recall 92.76%, dan f1-score 93.69%. Stabilitas model ini terkonfirmasi melalui 5-Fold Cross Validation yang mencatatkan rata-rata akurasi sebesar 95.58% dengan standar deviasi yang rendah yaitu 0.46%. Analisis mendalam menunjukkan bahwa penggunaan ADASYN pada dataset ini justru menurunkan performa model dibandingkan data asli akibat distorsi distribusi, sementara strategi slow learning dengan struktur pohon sederhana terbukti paling efektif. Penelitian ini memberikan kontribusi dalam penyediaan model deteksi dini Alzheimer yang tidak hanya berakurasi tinggi dan stabil, tetapi juga efisien dalam penggunaan fitur.
ENGLISH:
Alzheimer’s disease is a progressive neurodegenerative disorder in which early detection is essential to maximize the effectiveness of medical intervention. This study aims to develop an accurate Alzheimer’s disease classification model using the Extreme Gradient Boosting (XGBoost) algorithm and to analyze the impact of data preprocessing techniques on model performance. The dataset consists of 2,149 patient records with 35 clinical features. This research applies Pearson correlation-based feature selection, handles class imbalance using Adaptive Synthetic Sampling (ADASYN), and optimizes hyperparameters through Bayesian Optimization. Model validation is conducted comprehensively using 5-Fold Cross Validation to evaluate performance consistency. The results indicate that XGBoost achieves excellent classification performance. The best outcome is obtained in Scenario 10, which uses no balancing, a 60:40 train–test split, and feature selection with a Pearson threshold of 0.15, yielding a test accuracy of 95.58%, precision of 94.63%, recall of 92.76%, and an F1-score of 93.69%. The model’s stability is confirmed by 5-Fold Cross Validation, achieving an average accuracy of 95.58% with a low standard deviation of 0.46%. Further analysis reveals that applying ADASYN to this dataset reduces performance compared to the original data due to distributional distortion, whereas a slow-learning strategy with a simple tree structure proves to be the most effective. This study contributes an early detection model for Alzheimer’s disease that is not only highly accurate and stable, but also efficient in feature utilization.
ARABIC:
رض ألزهايمر هو اضطراب تنكسي عصبي تقدمي يتطلب الكشف المبكر لتعظيم فعالية العلاج الطبي. يهدف هذا البحث إلى بناء نموذج دقيق لتصنيف مرض ألزهايمر باستخدام خوارزمية تعزيز التدرج الأقصى XGBoost وتحليل تأثير تقنيات المعالجة المسبقة للبيانات على أداء النموذج. تتكون مجموعة البيانات المستخدمة من ٢١٤٩ سجلاً للمرضى مع ٣٥ ميزة سريرية. يطبق هذا البحث اختيار الميزات استنادًا إلى ارتباط بيرسون، ومعالجة عدم توازن البيانات باستخدام ADASYN، وتحسين المعلمات الفائقة باستخدام التحسين البايزي Bayesian Optimization. تم إجراء التحقق من صحة النموذج بشكل شامل باستخدام طريقة التحقق المتقاطع بخمس طيات 5-Fold Cross Validation لاختبار اتساق الأداء. أظهرت نتائج البحث أن نموذج XGBoost قادر على توفير أداء تصنيف ممتاز. تم الحصول على أفضل إنجاز في السيناريو ١٠، أي بدون موازنة وبنسبة تقسيم بيانات ٦٠:٤٠ وعتبة اختيار الميزات ٠.١٥، مما أدى إلى دقة اختبار بنسبة ٩٥.٥٨٪، ودقة Precision ٩٤.٦٣٪، واستدعاء Recall ٩٢.٧٦٪، ودرجة F1 بنسبة ٩٣.٦٩٪. تم تأكيد استقرار هذا النموذج من خلال التحقق المتقاطع بخمس طيات الذي سجل متوسط دقة قدره ٩٥.٥٨٪ مع انحراف معياري منخفض يبلغ ٠.٤٦٪. أظهر التحليل المتعمق أن استخدام ADASYN في مجموعة البيانات هذه أدى في الواقع إلى انخفاض أداء النموذج مقارنة بالبيانات الأصلية بسبب تشويه التوزيع، بينما أثبتت استراتيجية التعلم البطيء slow learning ذات هيكل الشجرة البسيط أنها الأكثر فعالية. يساهم هذا البحث في توفير نموذج للكشف المبكر عن مرض ألزهايمر الذي لا يتميز بالدقة العالية والاستقرار فحسب، بل يتميز أيضًا بالكفاءة في استخدام الميزات.
| Item Type: | Thesis (Undergraduate) |
|---|---|
| Supervisor: | Faisal, Muhammad and Utama, Shoffin Nahwa |
| Keywords: | Alzheimer; XGBoost; ADASYN; Bayesian Optimization; Seleksi Fitur; K-Fold Cross Validation; Alzheimer; XGBoost; ADASYN; Bayesian Optimization; Feature Selection; K-Fold Cross Validation; ألزهايمر; XGBoost; ADASYN; التحسين البايزي; اختيار السمات; التحقق المتقاطع K-Fold |
| Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining 11 MEDICAL AND HEALTH SCIENCES > 1117 Public Health and Health Services > 111711 Health Information Systems (incl. Surveillance) |
| Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
| Depositing User: | Aisyah Nur Fitriyah |
| Date Deposited: | 04 Mar 2026 09:13 |
| Last Modified: | 04 Mar 2026 09:13 |
| URI: | http://etheses.uin-malang.ac.id/id/eprint/83055 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |
