Laili, Salisatun Nur (2024) Optimasi klasifikasi K-Nearest Neighbors dengan seleksi fitur menggunakan Analysis Of Variance untuk prediksi penyakit liver. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
19650149.pdf Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) |
Abstract
INDONESIA :
Bertujuan untuk meningkatkan akurasi model klasifikasi K-Nearest Neighbors (K-NN) dalam memprediksi penyakit liver pada Indian Liver Patient Dataset (ILPD), penelitian ini fokus pada optimasi seleksi fitur. Teknik seleksi fitur yang digunakan adalah Analysis of Variance (ANOVA), yang berfungsi untuk memilih variabel yang paling signifikan dalam mempengaruhi hasil prediksi. Fitur yang terpilih kemudian melewati beberapa skenario uji coba dan digunakan sebagai input dalam model KNN, kemudian evaluasi model dilakukan dengan menggunakan confusion matrix. Penelitian menunjukkan dari seluruh skenario uji coba yang dilakukan, hasil rata-rata terbaik yang didapatkan ada pada rasio data 80:20 mengggunakan seleksi fitur yaitu diperoleh akurasi 70,17%, presisi 73,23%, recall 91,21%, dan f1-score 81,15%. Pada penelitian ini, hasil seleksi fitur yang lebih berpengaruh terhadap variabel target yaitu Total Bilirubin, Direct Bilirubin, dan Alkaline Phosphotase.
ENGLISH :
Aiming to improve the accuracy of the K-Nearest Neighbors (K-NN) classification model in predicting liver disease on the Indian Liver Patient Dataset (ILPD), this research focuses on feature selection optimization. The feature selection technique used is Analysis of Variance (ANOVA), which serves to identify the most significant variables affecting the prediction outcomes. The selected features undergo several testing scenarios and are used as input for the KNN model. Model evaluation is conducted using a confusion matrix. The study shows that among all the testing scenarios, the best average results were obtained with an 80:20 data ratio using feature selection, achieving an accuracy of 70.17%, precision of 73.23%, recall of 91.21%, and an F1-score of 81.15%. In this study, the features that were most influential on the target variable, according to the feature selection results, were Total Bilirubin, Direct Bilirubin, and Alkaline Phosphotase.
ARABIC :
يهدف هذا البحث إلى تحسين دقة نموذج تصنيف الجيران الأقرب (K-NN)في التنبؤ بأمراض الكبد باستخدام مجموعة بيانات مرضى الكبد الهندية (ILPD).ويركز على تحسين اختيار الميزات. التقنية المستخدمة لاختيار الميزات هي تحليل التباين (ANOVA). والتي تعمل على اختيار المتغيرات الأكثر أهمية في التأثير على نتائج التنبؤ. تمر الميزات المختارة بعدة سيناريوهات تجريبية وتستخدم كمدخلات في نموذج ثم يتم تقييم النموذج باستخدام مصفوفة الارتباك أظهرت الدراسة أنه من بين جميع السيناريوهات التجريبية التي أجريت، كانت أفضل النتائج المتوسطة التي تم الحصول عليها عند نسبة بيانات 80:20باستخدام اختيار الميزات، حيث تم الحصول على دقة 70.17%. ودقة (precision) 73.23%. واسترجاع. (recall)91.21%. ودرجة F1. بلغت. 81.15%. في هذه الدراسة، كانت نتائج اختيار الميزات الأكثر تأثيراً على المتغير الهدف هي إجمالي البيليروبين (Total Bilirubin) والبيليروبين المباشر(Direct Bilirubin) والفوسفاتاز القلوي (Alkaline Phosphatase).
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Aziz, Okta Qomaruddin and Crysdian, Cahyo |
Keywords: | K-Nearest Neighbors; Analysis of Variance; Seleksi Fitur; Prediksi Penyakit Liver; Optimasi Model; K-Nearest Neighbors; Analysis of Variance; Feature Selection; Liver Disease Prediction; Model Optimization; K-Nearest Neighbors;تحليل التباين ;اختيار الميزات; التنبؤ بأمراض الكبد; تحسين النموذج |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0806 Information Systems > 080605 Decision Support and Group Support Systems |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Salisatun Nur Laili |
Date Deposited: | 23 Jul 2024 08:28 |
Last Modified: | 23 Jul 2024 08:28 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/65686 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |