Responsive Banner

Implementasi algoritma random forest untuk klasifikasi risiko serangan jantung

Ilma, Nadia Mu'izzatul (2024) Implementasi algoritma random forest untuk klasifikasi risiko serangan jantung. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
200605110075.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB) | Preview

Abstract

INDONESIA:

Serangan jantung, yang merupakan penyebab kematian utama di Indonesia dan di dunia, dipicu oleh berbagai faktor seperti penyakit jantung koroner, tekanan darah tinggi, dan gaya hidup tidak sehat. Berdasarkan Global Burden of Disease dan Institute for Health and Metrics and Evaluation (IHME) pada tahun 2014-2019 penyakit jantung menjadi penyebab kematian tertinggi di Indonesia. Berdasarkan Laporan Status Global Penyakit Kardiovaskular pada tahun 2021 oleh World Health Organization (WHO) penyakit serangan jantung merupakan penyebab kematian kardiovaskular nomor satu di dunia, dengan 16,17% dari total kematian kardiovaskular. Penelitian ini bertujuan mengkaji implementasi algoritma Random Forest untuk mengklasifikasikan risiko serangan jantung. Dalam penelitian ini, data dianalisis menggunakan berbagai skenario pengujian, yaitu kombinasi penghapusan outliers dan teknik oversampling SMOTE. Pada masing-masing pengujian dilakukan dengan menggunakan 3 model pembagian data, yaitu model A dengan perbandingan data 90:10, model B dengan perbandingan data 80:20, dan model C dengan perbandingan data 75:25. Untuk masing-masing model dilakukan pengujian dengan 4 kelompok kombinasi data berdasarkan fitur penting. Hasil pengujian menunjukkan bahwa kombinasi penghapusan outliers dan SMOTE pada model A memberikan akurasi tertinggi sebesar 93%. Evaluasi lebih lanjut mengindikasikan bahwa algoritma Random Forest memiliki performa yang sangat baik dengan nilai akurasi, precision, recall, dan f1-score sebesar 100% dalam pengujian pada data Real. Temuan ini menunjukkan bahwa algoritma Random Forest efektif dalam mengklasifikasikan populasi yang berisiko serangan jantung, memberikan potensi untuk turut dalam upaya pencegahan dan penanganan dini penyakit jantung.

ENGLISH:

Heart attacks, which are the leading cause of death in Indonesia and worldwide, are triggered by various factors such as coronary heart disease, high blood pressure, and unhealthy lifestyles. Based on the Global Burden of Disease and the Institute for Health and Metrics and Evaluation (IHME) in 2014-2019, heart disease is the highest cause of death in Indonesia. Based on the Global Status Report on Cardiovascular Disease in 2021 by the World Health Organization (WHO), heart attack disease is the number one cause of cardiovascular death in the world, with 16.17% of total cardiovascular deaths. This study aims to examine the implementation of the Random Forest algorithm to classify the risk of heart attack. In this study, the data were analyzed using various testing scenarios, namely a combination of outlier removal and SMOTE oversampling techniques. Each test was conducted using 3 data division models, namely model A with a data ratio of 90:10, model B with a data ratio of 80:20, and model C with a data ratio of 75:25. For each model, 4 groups of data combinations based on important features were tested. The test results showed that the combination of outlier removal and SMOTE in model A gave the highest accuracy of 93%. Further evaluation indicated that the Random Forest algorithm performed very well with accuracy, precision, recall, and f1-score values of 100% in testing on Real data. These findings suggest that the Random Forest algorithm is effective in classifying populations at risk of heart attack, providing the potential to contribute to the prevention and early treatment of heart disease.

ARABIC:

تنجم النوبات القلبية، وهي السبب الرئيسي للوفاة في إندونيسيا والعالم، عن عوامل مختلفة مثل أمراض القلب التاجية وارتفاع ضغط الدم وأنماط الحياة غير الصحية. واستنادًا إلى العبء العالمي للأمراض ومعهد الصحة والقياسات والتقييم (IHME) في الفترة 2014-2019، فإن أمراض القلب هي السبب الرئيسي للوفاة في إندونيسيا. استنادًا إلى تقرير الحالة العالمية لأمراض القلب والأوعية الدموية في عام 2021 الصادر عن منظمة الصحة العالمية، فإن مرض النوبات القلبية هو السبب الأول لوفيات القلب والأوعية الدموية في العالم، حيث تبلغ نسبته 16.17% من إجمالي وفيات القلب والأوعية الدموية. يهدف هذا البحث إلى دراسة تطبيق خوارزمية الغابة العشوائية لتصنيف خطر الإصابة بالنوبات القلبية. في هذه الدراسة، تم تحليل البيانات باستخدام سيناريوهات اختبار مختلفة، وهي مزيج من تقنيات إزالة القيم المتطرفة وتقنيات أخذ العينات الزائدة من SMOTE. تم إجراء كل اختبار باستخدام 3 نماذج لتقسيم البيانات، وهي النموذج (أ) بنسبة بيانات 90:10، والنموذج (ب) بنسبة بيانات 80:20، والنموذج (ج) بنسبة بيانات 75:25. لكل نموذج، تم اختبار 4 مجموعات من مجموعات البيانات بناءً على السمات المهمة. أظهرت نتائج الاختبار أن الجمع بين إزالة القيم المتطرفة وSMOTE في النموذج (أ) بنسبة بيانات 90:10 أعطى أعلى دقة بنسبة 93%. أشار المزيد من التقييم إلى أن خوارزمية الغابة العشوائية كان أداؤها جيدًا جدًا حيث بلغت قيم الدقة والدقة والاستدعاء ودرجة f1 100% في الاختبار على بيانات حقيقية. تشير هذه النتائج إلى أن خوارزمية الغابة العشوائية فعالة في تصنيف الفئات السكانية المعرضة لخطر الإصابة بالنوبات القلبية، مما يوفر إمكانية المساهمة في الوقاية والعلاج المبكر لأمراض القلب.

Item Type: Thesis (Undergraduate)
Supervisor: Suhartono, Suhartono and Chamidy, Totok
Keywords: Klasifikasi; Risiko Serangan Jantung; Random Forest; SMOTE; Classification; Heart Attack Risk; التصنيف،; خطر الإصابة بالنوبات القلبية
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Nadia Mu'izzatul Ilma
Date Deposited: 24 Jul 2024 09:38
Last Modified: 24 Jul 2024 09:38
URI: http://etheses.uin-malang.ac.id/id/eprint/66031

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item