Nurussakinah, Nurussakinah (2024) Implementasi Algortima Random Forest dan teknik SMOTE untuk klasifikasi penyakit diabetes. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
200605110027.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (6MB) |
Abstract
ABSTRAK
Penyakit diabetes merupakan salah satu tantangan pada bidang kesehatan global. Berdasarkan IDF (International Diabetes Federation), Indonesia menempati urutan ke-5 yang memiliki penyakit diabetes tertinggi dunia. Pengidap diabetes di Indonesia mencapai 19.5 juta jiwa pada tahun 2021. Menurut Kementerian Kesehatan Republik Indonesia, diabetes adalah penyakit yang mematikan urutan ketiga dengan jumlah kematian sebesar 80% setiap tahunnya. Penelitian ini menggunakan salah satu algoritma yaitu Random Forest untuk klasifikasi penyakit diabetes. Tujuan dari penelitian ini yaitu mengklasifikasikan penyakit diabetes dengan algoritma Random Forest yang memberikan hasil akurat dan efisien dalam diagnosis dini pasien penderita diabetes. Data yang digunakan merupakan data sekunder yaitu “Diabetes Dataset” yang berasal dari Birla Institute of Technology (BIT) yang terdiri dari 952 data dan memiliki fitur sebanyak 17. Dari dataset, kemudian dilakukan tahap Preprocessing yang meliputi missing value, transformasi data, split data, Sycthetic Minority Oversampling Technique (SMOTE), normalisasi data dan seleksi fitur. SMOTE digunakan untuk menyeimbangkan data karena dataset yang digunakan tidak seimbang. Dari seleksi fitur, maka fitur yang digunakan hanya 10 yaitu RegularMedicine, Age, BMI, Family_Diabetes, Stress, HighBP, SoundSleep, PhysicallyActive, BPLevel dan Sleep. Skenario uji coba pada penelitian ini membagi data yang terdiri dari 3 bagian, yaitu skenario 1 rasio 90% data latih: 10% data uji, skenario 2 rasio 70% data latih: 30% data uji, skenario 3 rasio 50% data latih dan 50% data uhi. Pada masing-masing skenario diterapkan perbandingan antara menggunakan normalisasi dan tidak menggunakan normalisasi. Hasil performa terbaik diperoleh pada skenario 1 yang menggunakan normalisasi yaitu, menghasilkan akurasi sebesar 97%, presisi sebesar 100%, recall sebesar 94% dan yang terakhir yaitu f1-Score yang menghassilkan 97%.
ABSTRACT
Diabetes is one of the challenges in the global health sector. Based on the IDF (International Diabetes Federation), Indonesia is in 5th place with the highest incidence of diabetes in the world. People with diabetes in Indonesia will reach 19.5 million people in 2021. According to the Ministry of Health of the Republic of Indonesia, diabetes is the third most deadly disease with 80% of deaths every year. This research uses an algorithm, namely Random Forest, for classifying diabetes. The aim of this research is to classify diabetes using the Random Forest algorithm which provides accurate and efficient results in early diagnosis of patients with diabetes. The data used is secondary data, namely the "Diabetes Dataset" which comes from the Birla Institute of Technology (BIT) which consists of 952 data and has 17 features. From the dataset, the Preprocessing stage is then carried out which includes missing values, data transformation, split data, Sycthetic Minority Oversampling Technique (SMOTE), data normalization and feature selection. SMOTE is used to balance data because the dataset used is unbalanced. From the feature selection, only 10 features are used, namely RegularMedicine, Age, BMI, Family_Diabetes, Stress, HighBP, SoundSleep, PhysicallyActive, BPLevel and Sleep. The test scenario in this research divides the data into 3 parts, namely scenario 1 ratio 90% training data: 10% test data, scenario 2 ratio 70% training data: 30% test data, scenario 3 ratio 50% training data and 50 % uhi data. In each scenario, a comparison is applied between using normalization and not using normalization. The best performance results were obtained in scenario 1 which used normalization, namely, producing an accuracy of 97%, precision of 100%, recall of 94% and finally, f1-Score which produced 97%.
البحث مستخلص
يعد مرض السكري أحد التحديات التي يواجهها قطاع الصحة العالمي. وفقًا للاتحاد الدولي للسكري ، تحتل إندونيسيا المركز الخامس من حيث أعلى معدلات الإصابة بمرض السكري في العالم. سيصل عدد المصابين بالسكري في إندونيسيا إلى مليون شخص في عام. ووفقًا لوزارة الصحة في جمهورية إندونيسيا، يعد مرض السكري ثالث أكثر الأمراض فتكًا حيث يتسبب في من الوفيات كل عام. يستخدم هذا البحث خوارزمية لتصنيف مرض السكري. الهدف من هذا البحث هو تصنيف مرض السكري باستخدام خوارزمية التي توفر نتائج دقيقة وفعالة في التشخيص المبكر للمرضى المصابين بالسكري. البيانات المستخدمة هي بيانات ثانوية، وهي "مجموعة بيانات مرض السكري" التي تأتي من معهد بيرلا للتكنولوجيا والتي تتكون من بيانات ولها ميزة من مجموعة البيانات، يتم بعد ذلك تنفيذ مرحلة المعالجة المسبقة والتي تتضمن القيم المفقودة، تحويل البيانات، وتقسيم البيانات، وتقنية الإفراط في أخذ عينات الأقلية الاصطناعية، وتطبيع البيانات واختيار الميزات. يتم استخدام لموازنة البيانات لأن مجموعة البيانات المستخدمة غير متوازنة. من اختيار الميزات، يتم استخدام ميزات فقط، وهي والنوم. يقسم سيناريو الاختبار في هذا البحث البيانات إلى أجزاء، وهي السيناريو نسبة بيانات التدريب: بيانات الاختبار، السيناريو نسبة بيانات التدريب: بيانات الاختبار، السيناريو نسبة بيانات التدريب و بيانات أوهي. في كل سيناريو، يتم تطبيق مقارنة بين استخدام التسوية وعدم استخدام التسوية. تم الحصول على أفضل نتائج الأداء في السيناريو الذي استخدم التطبيع، أي إنتاج دقة، دقة، استدعاء، وأخيراً الذي أنتج.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Faisal, Muhammad and Budi Santoso, Irwan |
Keywords: | Klasifikasi; Penyakit Diabetes; Random Forest; SMOTE; Classification; Diabetes; Random Forest; SMOTE; التصنيف; مرض السكري; الغابة العشوائية; سموتي |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Nurussakinah Nurussakinah |
Date Deposited: | 08 Jul 2024 15:29 |
Last Modified: | 08 Jul 2024 15:29 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/65251 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |