Responsive Banner

Penerapan adaptive boosting-support vector machine pada klasifikasi pasien kanker paru-paru berdasarkan faktor risiko

Nursafitri, Aulia (2026) Penerapan adaptive boosting-support vector machine pada klasifikasi pasien kanker paru-paru berdasarkan faktor risiko. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
220601110087.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(6MB)

Abstract

INDONESIA

Penelitian ini menerapkan algoritma gabungan Support Vector Machine (SVM) dengan Adaptive Boosting (AdaBoost) untuk mengklasifikasikan pasien kanker paru-paru berdasarkan faktor risiko dengan SVM sebagai base learner. SVM bekerja dengan mencari hyperplane optimal untuk memisahkan data ke dalam dua kelas, yaitu kelas positif dan kelas negatif. Sementara itu, AdaBoost digunakan untuk meningkatkan performa model dengan menggabungkan beberapa model sederhana menjadi model yang lebih akurat melalui pembaruan bobot pada setiap iterasi. Data yang digunakan merupakan data sekunder pasien kanker paru-paru tahun 2020-2025 yang diperoleh dari rekam medis RSUD Karsa Husada Batu. Tahap analisis meliputi penanganan missing value menggunakan imputasi modus, standardisasi data, pembagian data training dan data testing, serta pelatihan model menggunakan kernel linear dengan parameter terbaik cost(C)=10 dan melakukan boosting sebanyak 10 iterasi. Evaluasi model dilakukan menggunakan 5-Fold Cross Validation dan Confusion Matrix. Hasil evaluasi 5-Fold Cross Validation memperoleh nilai rata-rata akurasi sebesar 89.96% yang menunjukkan tingkat kestabilan model. Selain itu, hasil evaluasi Confusion Matrix memperoleh nilai akurasi sebesar 76.92% yang menunjukkan bahwa model AdaBoost-SVM mampu mengklasifikasikan sebagian besar pasien kanker paru-paru dengan benar. Selanjutnya, nilai recall sebesar 50%, presisi sebesar 33.33%, dan F1-Score sebesar 40%. Nilai metrik evaluasi tersebut dipengaruhi oleh kondisi data yang tidak seimbang (data imbalanced) di mana jumlah pasien stadium IV lebih banyak dibandingkan pasien stadium III.

ENGLISH

This study applied a combined algorithm of Support Vector Machine (SVM) with Adaptive Boosting (AdaBoost) to classify lung cancer patients based on risk factors, with SVM as the base learner. SVM works by finding the optimal hyperplane to separate the data into two classes: positive and negative. Meanwhile, AdaBoost improves model performance by combining multiple simple models into more accurate ones through weight updates at each iteration. The data used is secondary data on lung cancer patients in 2020-2025, obtained from the medical records of Karsa Husada Batu Hospital. The analysis stage includes handling missing values with mode imputation, data standardization, splitting the data into training and test sets, and training a linear kernel model with C = 10 and boosting for up to 10 iterations. Model evaluation was performed using 5-fold cross-validation and a Confusion Matrix. The results of the 5-Fold Cross Validation evaluation yielded an average accuracy of 89.96%, indicating the model's stability. In addition, the Confusion Matrix evaluation yielded an accuracy of 76.92%, indicating that the AdaBoost-SVM model can classify most lung cancer patients. Furthermore, the recall value is 50%, the precision is 33.33%, and the F1-Score is 40%. The evaluation metric was influenced by an imbalance in the data, with more stage IV patients than stage III patients.

ARABIC

طبقت هذه الدراسة خوارزمية هجينة تجمع بين آلة المتجهات الداعمة (SVM) وتقنية التعزيز التكيفي (AdaBoost) لتصنيف مرضى سرطان الرئة بناءً على عوامل الخطر، حيث استُخدمت خوارزمية SVM بوصفها المتعلم الأساسي (base learner). تعمل خوارزمية SVM على إيجاد المستوى الفاصل الأمثل (hyperplane) لفصل البيانات إلى فئتين، هما الفئة الإيجابية والفئة السلبية، في حين تُستخدم AdaBoost لتحسين أداء النموذج من خلال تحديث الأوزان في كل تكرار. اعتمدت الدراسة على بيانات ثانوية لمرضى سرطان الرئة خلال الفترة 2020–2025، والتي تم الحصول عليها من السجلات الطبية لمستشفى RSUD Karsa Husada Batu. شملت مراحل التحليل معالجة القيم المفقودة باستخدام تعويض المنوال، وتوحيد البيانات، وتقسيم البيانات إلى بيانات تدريب واختبار، بالإضافة إلى تدريب النموذج باستخدام النواة الخطية (linear kernel) مع أفضل قيمة للمعلمة C=10 وتنفيذ عملية التعزيز لمدة 10 تكرارات. تم تقييم النموذج باستخدام أسلوب التحقق المتقاطع بخمس طيات (5-Fold Cross Validation) ومصفوفة الالتباس (Confusion Matrix). أظهرت نتائج التحقق المتقاطع متوسط دقة بلغ 89.96% مما يدل على استقرار أداء النموذج، كما أظهرت نتائج مصفوفة الالتباس دقة مقدارها 76.92% مما يشير إلى قدرة نموذج AdaBoost-SVM على تصنيف معظم مرضى سرطان الرئة. إضافة إلى ذلك، بلغت قيمة الاسترجاع (Recall) 50%، والدقة النوعية (Precision) 33.33%، ودرجة F1-Score مقدارها 40%. وقد تأثرت قيم مقاييس التقييم بحالة عدم توازن البيانات (imbalanced data)، حيث كان عدد مرضى المرحلة الرابعة أكبر من عدد مرضى المرحلة الثالثة.

Item Type: Thesis (Undergraduate)
Supervisor: Karisma, Ria Dhea Layla Nur and Juhari, Juhari
Keywords: Klasifikasi; Support Vector Machine; Adaptive Boosting; Kanker Paru-Paru; Faktor Risiko; Classification; Support Vector Machine; Adaptive Boosting; Lung Cancer; Risk Factor; عوامل الخطر ;سرطان الرئة ;تعزيز التكيف ;آلات المتجهات الداعمة ;التصنيف
Subjects: 01 MATHEMATICAL SCIENCES > 0104 Statistics > 010401 Applied Statistics
Departement: Fakultas Sains dan Teknologi > Jurusan Matematika
Depositing User: Aulia Nursafitri
Date Deposited: 17 Jun 2026 09:39
Last Modified: 17 Jun 2026 09:39
URI: http://etheses.uin-malang.ac.id/id/eprint/85327

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item