Responsive Banner

Deteksi penyakit serangan jantung menggunakan Random Forest dengan Variasi Synthetic Minority Oversampling Technique (SMOTE) dan Principal Component Analysis (PCA)

Arifin, Miftahul (2026) Deteksi penyakit serangan jantung menggunakan Random Forest dengan Variasi Synthetic Minority Oversampling Technique (SMOTE) dan Principal Component Analysis (PCA). Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
220605110161.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(2MB)

Abstract

ABSTRAK:

Penelitian ini bertujuan mengevaluasi efektivitas algoritma Random Forest melalui empat skenario pemodelan (standar, dengan PCA, dengan SMOTE, serta kombinasi keduanya) untuk mendeteksi serangan jantung pada populasi Indonesia menggunakan dataset 158.355 pasien. Metode penelitian mencakup prapemrosesan variabel kategorikal, penyeimbangan kelas dengan SMOTE, dan reduksi dimensi dengan PCA. Hasil menunjukkan bahwa Skenario Model 3 (Random Forest dengan SMOTE) memberikan performa paling unggul dan stabil. Dengan teknik One-Hot Encoding, model ini mencapai akurasi 80,87% dan skor ROC-AUC 89,56%. Sebaliknya, penerapan PCA menurunkan performa karena menghilangkan informasi penting pada fitur medis yang bersifat independen. Strategi penyeimbangan data merupakan faktor paling krusial dalam meningkatkan sensitivitas deteksi dini serangan jantung dibandingkan reduksi dimensi fitur.

ABSTRACT:

This research evaluates the Random Forest algorithm across four scenarios (standard, PCA, SMOTE, and hybrid) to optimize heart attack Detection in the Indonesian population using a dataset of 158,355 entries. The methodology includes categorical encoding, SMOTE for class balancing, and PCA for dimension reduction. Results indicate that Model Scenario 3 (Random Forest with SMOTE) provides the most superior and stable performance. Utilizing One-Hot Encoding, this model achieved 80.87% accuracy and an 89.56% ROC-AUC score. Conversely, PCA reduced performance by losing critical independent medical features. Data balancing is more vital than feature dimension reduction for enhancing early heart attack Detection sensitivity.

مستخلص البحث:

، مع PCA قياسي، مع ( هتدف هذه الدراسة إىل تقييم فعالية خوارزمية الغابة العشوائية من خالل أربعة سيناريوهات للنمذج ة SMOTE ١٥٨٫٣٥٥ للكشف عن النوابت القلبية يف السكان اإلندونيسيني ابستخدام جمموعة بياانت تضم ) ، ومزيج من االثنني ، وتقليل األبعاد ابستخدام SMOTE مريضً ا. تضمنت طريقة البحث املعاجلة املسبقة للمتغريات الفئوية، وموازنة الفئات ابستخدا م PCA. ٣ أظهرت النتائج أن سيناريو النموذج Random Forest) مع (SMOTE .قدم األداء األفضل واألكثر استقرار ً ابنسبة ROC-AUC ودرجة . ٨٠٫٨٧ ٪ حقق هذا النموذج دقة بنسبة ، One-Hot Encoding ابستخدام تقنية الرتميز إىل اخنفاض األداء ألنه أزال معلومات مهمة عن السمات الطبية املستقلة. PCA على العكس من ذلك، أدى تطبيق . ٨٩٫٥٦ ٪ كانت اسرتاتيجية موازنة البياانت هي العامل األكثر أمهية يف حتسني حساسية الكشف املبكر عن النوابت القلبية مقارنة بتقليل أبعاد . ا

Item Type: Thesis (Undergraduate)
Supervisor: Hariyadi, M. Amin and Qomaruddin, Okta and Crysdian, Cahyo and Inda Melani, Roro
Keywords: Random Forest; SMOTE; PCA; Serangan Jantung. Random Forest; SMOTE; PCA; Heart Attack. ا Random Forest; SMOTE; PCA; النوبة القلبية.
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0803 Computer Software > 080301 Bioinformatics Software
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Miftahul Arifin
Date Deposited: 11 Mar 2026 13:36
Last Modified: 11 Mar 2026 13:36
URI: http://etheses.uin-malang.ac.id/id/eprint/83882

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item