Artanti, Vera (2024) Klasifikasi penyakit kardiovaskular menggunakan algoritma K-Nearest Neighbors (KNN). Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
200605110039.pdf Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) |
Abstract
INDONESIA:
Penyakit kardiovaskular merupakan salah satu tantangan serius dalam bidang kesehatan global. Menurut data penyakit kardiovaskular menduduki peringkat pertama sebagai penyebab kematian di seluruh dunia. Pada tahun 2019 diperkirakan sekitar 17,9 juta kematian akibat penyakit kardiovaskular, atau sekitar 32% dari total kematian global. Salah satu kejadian umum dari penyakit ini adalah gagal jantung, yang memiliki dampak serius pada kualitas hidup dan harapan hidup individu. Dalam penelitian ini digunakan metode K-Nearest Neighbors (KNN) untuk mengklasifikasikan penyakit kardiovaskular. Tujuan penelitian ini adalah mengetahui kinerja K-Nearest Neighbors (KNN) dengan baik melalui perhitungan accuracy, recall, precision, dan f1-score pada klasifikasi penyakit kardiovaskular. Fitur yang digunakan antara lain time, serum creatine, ejection fraction, age, serum sodium, creatine phosphokinase, platelets. Data yang digunakan pada penelitian ini adalah data “Heart Failure Prediction” yang diambil dari BMC Medical Informatics and Decision Making berdasarkan rekam medis 299 pasien gagal jantung yang kemudian dilakukan Preprocessing data yang meliputi seleksi fitur, SMOTE, normalisasi data, serta split data. Pada penelitian ini split data terbagi menjadi 3 model, yaitu model A dengan perbandingan 80% data pelatihan: 20% data pengujian, model B dengan perbandingan 70% data pelatihan: 30% data pengujian, model C dengan perbandingan 60% data pelatihan: 40% data pengujian. Selanjutnya pada masing-masing pembagian model akan dilakukan perbandingan antara pengujian tidak menggunakan seleksi fitur dan tidak dilakukan proses SMOTE dengan pengujian menggunakan seleksi fitur dan dilakukan proses SMOTE. Nilai akurasi terbaik pada model C rasio data 60% data pelatihan dan 40% data pengujian yang telah dilakukan seleksi fitur dan proses SMOTE dengan nilai akurasi 90% dan nilai AUC 94% serta didapatkan nilai presisi 89%, recall 90%, dan f1-score 90%.
ENGLISH:
Cardiovascular disease is one of the most serious challenges in global health. According to data, cardiovascular disease is the number one cause of death worldwide. In 2019, an estimated 17.9 million deaths from cardiovascular disease are expected, or about 32% of total global deaths. One of the common occurrences of these diseases is heart failure, which has a serious impact on the quality of life and life expectancy of individuals. In this study, the K-Nearest Neighbors (KNN) method was used to classify cardiovascular diseases. The aim of this study is to evaluate the effectiveness of K-Nearest Neighbors (KNN) well through the calculation of accuracy, recall, precision, and f1-score in the classification of cardiovascular diseases. The features used include time, serum creatine, ejection fraction, age, serum sodium, creatine phosphokinase, platelets. The data used in this study is the "Heart Failure Prediction" data taken from BMC Medical Informatics and Decision Making based on the medical records of 299 heart failure patients which are then subjected to data Preprocessing which includes feature selection, SMOTE, data normalization, and data split. In this study, the split data is divided into 3 models, namely model A with a ratio of 80% training data: 20% testing data, model B with a ratio of 70% training data: 30% testing data, model C with a ratio of 60% training data: 40% testing data. Furthermore, in each division of the model, a comparison will be made between testing not using feature selection and not doing the SMOTE process with testing using feature selection and doing the SMOTE process. The best accuracy value is in model C with a data ratio of 60% training data and 40% test data that has been carried out feature selection and SMOTE process with an accuracy value of 90% and an AUC value of 94% and obtained a precision value of 89%, recall 90%, and f1-score 90%.
ARABIC:
تعد أمراض القلب والأوعية الدموية أحد أخطر التحديات في مجال الصحة العالمية. ووفقاً للبيانات، فإن أمراض القلب والأوعية الدموية هي السبب الأول للوفاة في جميع أنحاء العالم. في عام 2019، من المتوقع حدوث ما يقدر بنحو 17.9 مليون حالة وفاة بسبب أمراض القلب والأوعية الدموية، أو حوالي 32% من إجمالي الوفيات العالمية. أحد الأمراض الشائعة لهذه الأمراض هو قصور القلب، والذي له تأثير خطير على جودة الحياة ومتوسط العمر المتوقع للأفراد. في هذه الدراسة، تم استخدام طريقة K-Nearest Neighbours (KNN) لتصنيف أمراض القلب والأوعية الدموية. والغرض من هذه الدراسة هو تحديد أداء طريقة K-Nearest Neighbours (KNN) بشكل جيد من خلال حساب الدقة والاستدعاء والدقة ودرجة f1 في تصنيف أمراض القلب والأوعية الدموية. تشمل السمات المستخدمة الوقت والكرياتين في المصل والجزء المقذوف والعمر والصوديوم في المصل وفوسفوكيناز الكرياتين والصفائح الدموية. والبيانات المستخدمة في هذه الدراسة هي بيانات "Heart Failure Prediction" المأخوذة من BMC للمعلوماتية الطبية واتخاذ القرار بناءً على السجلات الطبية لـ 299 مريضًا بقصور القلب، ثم أجريت المعالجة المسبقة للبيانات التي تتضمن اختيار السمات و SMOTE وتطبيع البيانات وتقسيم البيانات. في هذه الدراسة، تم تقسيم البيانات المقسمة إلى 3 نماذج، وهي النموذج A بنسبة 80% بيانات تدريب: 20% بيانات اختبار، والنموذج B بنسبة 70% بيانات تدريب: 30% بيانات اختبار، والنموذج C بنسبة 60% بيانات تدريب: 40% بيانات اختبار. علاوة على ذلك، في كل قسم من أقسام النماذج، سيتم إجراء مقارنة بين الاختبار الذي لا يستخدم اختيار الملامح وعدم إجراء عملية SMOTE مع الاختبار الذي يستخدم اختيار الملامح وإجراء عملية SMOTE. أفضل قيمة دقة هي في النموذج (ج) بنسبة بيانات 60% بيانات تدريب و40% بيانات اختبار والتي تم إجراء عملية اختيار الملامح وعملية SMOTE بقيمة دقة 90% وقيمة AUC 94% وحصل على قيمة دقة 89% واسترجاع 90% ودرجة f1 90%.
Downloads
Downloads per month over past year
Actions (login required)
View Item |