Harmadi, Bagas (2022) Penerapan algoritma decision tree pada prediksi risiko terserang stroke. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
18610113.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
INDONESIA:
Kesehatan merupakan aspek yang paling penting bagi kehidupan manusia. Saat ini banyak penyakit yang diderita yang disebabkan oleh kuman, virus dan bakteri, tetapi penyebab yang paling utama adalah kebiasaan atau pola hidup yang tidak sehat. Stroke menjadi salah satu dari penyakit-penyakit yang diderita tersebut. Oleh karena itu, diperlukan sebuah analisis mengenai prediksi seseorang akan terkena penyakit, seperti penelitian terkait prediksi terserang Stroke. Penelitian ini bertujuan untuk mengetahui model dan hasil prediksi risiko terserang Stroke pada manusia dengan menggunakan algoritma Decision Tree. Metode ini memiliki tingkat akurasi yang baik dan efektif dalam pengambilan keputusan. Dari delapan faktor yang menjadi penyebab seseorang terkena Stroke, yaitu Jenis Kelamin, Umur, Hipertensi, Sakit Jantung, Jenis Tempat Tinggal, Kadar Glukosa, Index Mass Tubuh (BMI) dan Status Merokok didapatkan hasil prediksi risiko terserang Stroke dengan 360 data menggunakan algoritma Decision Tree C4.5 dan bantuan tool RapidMiner dengan persentase keakuratan 68.89%, precision sebesar 68.68%, recall sebesar 69.4% dan Kurva ROC diperoleh AUC 0.726. Hasil ini menunjukkan bahwa model pada metode Decision Tree termasuk dalam klasifikasi cukup (fair classification). Selanjutnya, dengan menggunakan 360 data diperoleh model tree dengan hasil 28 aturan keputusan, serta faktor yang paling dominan yang menjadi penyebab Stroke adalah Umur pada usia diatas 65 Tahun.
ENGLISH:
Health is the most important aspect of human life. Germs, viruses and bacteria cause many illnesses, but the main causes are unhealthy habits or lifestyles. Stroke is one of these diseases. Therefore, an analysis is needed regarding the prediction that someone will get a disease, such as research related to stroke prediction. This study aims to determine the model and predictive results of stroke risk in humans using the Decision Tree algorithm. This method has a good level of accuracy and it is effective in decision-making. From that eight factors that cause a person to have a Stroke are Gender, Age, Hypertension, Heart Disease, Type of Residence, Glucose Levels, Body Mass Index (BMI) and Smoking Status, the risk prediction results for Stroke are obtained with 360 data using the Decision Tree algorith. C4.5 and the result of the RapidMiner tool with an accuracy percentage of 68.89%, precision of 68.68%, recall of 69.4% and the ROC curve obtained AUC 0.726. These results indicate that the model in the Decision Tree method is included in the appropriate classification (fair classification). Furthermore, using 360 data, a tree model was obtained with the results of 28 decision rules, and the most dominant factor that causes Stroke is the age that over 65 years.
ARABIC:
الصحة هي أهم جانب في حياة الإنسان. تسبب الجراثيم والفيروسات والبكتيريا العديد من الأمراض، ولكن الأسباب الرئيسية هي العادات أو أنماط الحياة غير الصحية. السكتة الدماغية هي من إحدى الأمراض. لذلك، هناك حاجة إلى تحليل فيما يتعلق بالتنبؤ بإصابة شخص ما بمرض، مثل البحث المتعلق بالتنبؤ بالسكتة الدماغية. تهدف هذه الدراسة إلى تحديد النموذج والنتائج التنبؤية لمخاطر السكتة الدماغية لدى البشر باستخدام خوارزمية شجرة القرار. تتمتع هذه الطريقة بمستوى جيد من الدقة وهي فعالة في اتخاذ القرار. من بين العوامل الثمانية التي تسبب إصابة الشخص بالسكتة الدماغية، وهي الجنس (Gender) والعمر (Age) وارتفاع ضغط الدم (Hypertension) وأمراض القلب (Heart Disease) ونوع المقيم (Resident Type) ومتوسط مستوى الجلوكوز (Avg Glucose Level) ومؤشر كتلة الجسم (Body Mass Index) وحالة التدخين (Smoking Status)، يتم الحصول على نتائج التنبؤ بمخاطر الإصابة بالسكتة الدماغية باستخدام 360 البيانات باستخدام خوارزمية شجرة القرار ج4.5 (Decision Tree C4.5) ومساعدة أداة رابيدماينر (RapidMiner) بنسبة دقة تبلغ 68.89٪ ودقة (Precision) حصل 68.68٪ واسترجاع (Recall) حصل 69.4٪ وخاصية تشغيل مستقبل كورفا (Kurva Receiver Operating Characteristic) على المنطقة تحت المنحنى (Area Under Curve) 0.726 تشير هذه النتائج إلى أن النموذج الموجود في طريقة شجرة القرار مدرج في التصنيف المناسب (تصنيف عادل/Fair Classification). علاوة على ذلك، باستخدام بيانات 360، تم الحصول على نموذج شجرة بنتائج 28 قاعدة قرار، والعامل الأكثر انتشارًا الذي يسبب السكتة الدماغية هو العمر (Age) الذي يزيد عن 65 عامًا.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Fahmi, Hisyam and Herawati, Erna | |||||||||
Contributors: |
|
|||||||||
Keywords: | Decision Tree; Prediksi Terserang Stroke; RapidMiner; Decision Tree; RapidMiner; Stroke Prediction; أشجار القرار؛ توقع السكتة الدماغية؛ رابيدماينر | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Matematika | |||||||||
Depositing User: | Bagas Harmadi | |||||||||
Date Deposited: | 03 Jan 2023 10:27 | |||||||||
Last Modified: | 03 Jan 2023 10:27 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/43045 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |