Ghozali, Muhammad Imam (2024) Implementasi metode gaussian naïve bayes untuk membangun model prediksi serangan jantung. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
200605110154.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) |
Abstract
INDONESIA:
Penyakit jantung merupakan penyebab utama kematian di dunia, termasuk di Indonesia. Data dari WHO tahun 2015 menunjukkan 17 juta kematian global akibat penyakit ini, sementara di Indonesia sekitar 12,9% kematian disebabkan oleh penyakit jantung berdasarkan data RISKESDAS 2018 dan SRS 2014. Hal ini menunjukkan bahwa masih banyak orang yang tidak serius menanggapi penyebab penyakit jantung, sehingga banyak kasus ditemukan di stadium lanjut setelah pemeriksaan kesehatan. Cara mengatasi penyakit jantung dengan kondisi serupa meliputi operasi, penyinaran, dan kemoterapi, namun pencegahan tetap menjadi pilihan terbaik melalui gaya hidup sehat dan pemeriksaan rutin. Penelitian ini bertujuan untuk memprediksi serangan jantung menggunakan metode Gaussian Naive Bayes dengan memanfaatkan dataset rekam medis pasien dari Elsevier Mendeley Data Repository yang terdiri dari 1.319 data. Setelah melalui tahapan preprocessing seperti Label Encoding dan normalisasi data, dataset dibagi menjadi data latih dan data uji dengan rasio berbeda (90:10, 80:20, 70:30, 65:35). Evaluasi model menggunakan Confusion Matrix menunjukkan akurasi prediksi bervariasi dari 70% hingga 92%. Pengujian tambahan dengan K-fold cross validation (K=5, 10, 15, 20) menunjukkan akurasi tertinggi 88,26% pada K=5 dan terendah 57,95% pada K=15, dengan rata-rata akurasi tertinggi 70,43% pada K=5. Hasil penelitian ini menunjukkan bahwa model Gaussian Naive Bayes dapat memprediksi serangan jantung dengan baik, meskipun terdapat variasi akurasi berdasarkan pembagian data dan metode validasi yang digunakan.
ENGLISH:
Heart disease is the leading cause of death worldwide, including in Indonesia. WHO data from 2015 shows 17 million global deaths due to this disease, while in Indonesia, around 12.9% of deaths are caused by heart disease according to RISKESDAS 2018 and SRS 2014 data. This indicates that many people do not take the causes of heart disease seriously, resulting in many cases being discovered at an advanced stage after health examinations. Methods to address heart disease in similar conditions include surgery, radiation, and chemotherapy, but prevention remains the best option through a healthy lifestyle and regular check-ups. This study aims to predict heart attacks using the Gaussian Naive Bayes method by utilizing a medical record dataset from the Elsevier Mendeley Data Repository consisting of 1,319 data points. After preprocessing steps such as Label Encoding and data normalization, the dataset was divided into training and test data with different ratios (90:10, 80:20, 70:30, 65:35). Model evaluation using a Confusion Matrix showed prediction accuracy varying from 70% to 92%. Additional testing with K-fold cross validation (K=5, 10, 15, 20) showed the highest accuracy of 88.26% at K=5 and the lowest at 57.95% at K=15, with the highest average accuracy of 70.43% at K=5. The results of this study indicate that the Gaussian Naive Bayes model can predict heart attacks well, although there is variability in accuracy based on data partitioning and validation methods used.
ARABIC:
مرض القلب هو السبب الرئيسي للوفاة في العالم ، بما في ذلك في إندونيسيا. أظهرت بيانات منظمة الصحة العالمية في عام 2015 وجدت 17 مليون حالة وفاة عالمية بسبب هذا المرض ، بينما في إندونيسيا حوالي %12.9% من الوفيات كانت ناجمة عن أمراض القلب بناء على بيانات RISKESDAS 2018 و SRS 2014. هذا يدل على أنه لا يزال هناك الكثير من الأشخاص الذين لا يأخذون سبب مرض القلب على محمل الجد ، لذلك يتم العثور على العديد من الحالات في مرحلة متقدمة بعد الفحص الطبي . تشمل طرق التعامل مع أمراض القلب ذات الحالات المماثلة الجراحة والإشعاع والعلاج الكيميائي ، لكن الوقاية تظل الخيار الأفضل من خلال نمط حياة صحي وفحوصات منتظمة تهدف هذه الدراسة إلى التنبؤ بالنوبة القلبية باستخدام طريقة Gaussian Naive Bayes من خلال استخدام مجموعة بيانات من السجلات الطبية للمرضى من مستودع بيانات Mendeley Elsevier الذي يتكون من 1,319 بيانات بعد المرور بمراحل المعالجة المسبقة مثل ترميز الملصقات وتطبيع البيانات ، تم تقسيم مجموعة البيانات إلى بيانات تدريب وبيانات اختبار بنسب مختلفة 90:10 ، 80:20 ، 70:30 ، 65:35). أظهر تقييم النموذج باستخدام مصفوفة الارتباك أن دقة التنبؤ تراوحت من 70 إلى 92 أظهرت الاختبارات الإضافية مع التحقق المتقاطع = K-fold (K 5، 10، 15، 20 ) أعلى دقة بنسبة 88.26% عند 5 = K وأدنى دقة بنسبة 57.95% عند 15 = K ، مع أعلى متوسط دقة %70.43 عند 5 تظهر نتائج هذه الدراسة أن نموذج Gaussian Naive Bayes يمكنه التنبؤ بالنوبات القلبية بشكل جيد ، على الرغم من وجود اختلافات في الدقة بناء على مشاركة البيانات وطرق التحقق المستخدمة.
م
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |