Responsive Banner

Klasifikasi penyakit diabetes menggunakan metode Naive Bayes Classifier

Erlangga, Denis (2024) Klasifikasi penyakit diabetes menggunakan metode Naive Bayes Classifier. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
19650012.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (1MB) | Preview

Abstract

Indonesia
Penelitian sebagai klasifikasi untuk penyakit diabetes yang mengimplementasikan metode dari bagian machine learning yaitu Naïve Bayes classifier, dari penerapan metode ini menghasilkan nilai ketepatan dalam prediksi data menggunakan bahasa pemrograman python. Data yang digunakan yaitu Pima Indians Diabetes Database yang diperoleh melalui situs publik. Isi dari dataset yakni pasien perempuan dengan usia diatas 21 tahun. Data diproses melalui tahapan eliminasi data, balancing data, dan scaling data lalu dilakukan pemisahan data dengan empat rasio perbandingan data latih dan data uji diantaranya 90:10, 80:20, 75:25, dan 70:30. Dari empat rasio perbandingan tersebut, yang menghasilkan performa model dalam memprediksi ketepatan data yang terbaik didapatkan dari rasio perbandingan 90:10 menghasilkan akurasi sebesar 80% yang dikategorikan baik, presisi pasien positif diabetes sebesar 88%, presisi pasien negatif diabetes sebesar 73%, recall pasien positif diabetes sebesar 74%, recall pasien negatif diabetes sebesar 87%, f1 score pasien positif diabetes sebesar 80%, dan f1 score pasien negatif diabetes sebesar 79%. Serta penerapan teknik validasi silang k-fold cross validation dengan nilai k sama dengan 10. Diperoleh nilai akurasi dari proses iterasi sepuluh kali menghasilkan nilai ketepatan prediksi data yang optimal dihasilkan dari nilai k=7 dengan nilai sebesar 84,06%.

Inggris
The research classifies diabetes by implementing a part of machine learning, the Naïve Bayes Classifier. The method implementation generates data prediction accuracy score using python programming. The data is from the Pima Indians Diabetes Database, taken from a public website. The dataset contains female patients above 21 years old. The data processing consists of data elimination, balancing, and scaling. Then, the data are separated into four ratios of training and testing data, namely 90:10, 80:20, 75:25, and 70:30. From the comparison of four ratios, the model performance generating the best data prediction accuracy is the ratio 90:10, leading to 80% accuracy, and is categorized as sufficient. In addition, the precision of positive and negative diabetes patients is 88% and 73%, respectively. The recall of positive and negative diabetes patients is 74% and 87%, respectively. The f1-score of positive and negative diabetes patients is 80% and 79%, respectively. The implementation of the K-Fold Cross Validation technique shows k = 10. The iteration process, conducted ten times, indicates an optimal data prediction accuracy of 84.06 with k=7.

Arab
البحث كتصنيف لمرض السكري الذي ينفذ طريقة من قسم أجهزة التعليم، وهي المصنف البايزي الساذج (Naïve Bayes Classifier)، من تطبيق هذه الطريقة ينتج قيمة الدقة في التنبؤ بالبيانات باستخدام لغة برمجة Python. البيانات المستخدمة هي قاعدة بيانات Pima Indians Diabetes Database التي تم الحصول عليها من خلال موقع ويب عام. محتوى مجموعة البيانات هو المرضى الإناث فوق سن 21 عاما. تمت معالجة البيانات من خلال مراحل حذف البيانات وموازنة البيانات وتحجيم البيانات، ثم تم فصل البيانات بأربع نسب مقارنة بين بيانات التدريب وبيانات الاختبار، بما في ذلك 90:10 و 80:20 و 75:25 و 70:30. من بين نسب المقارنة الأربعة، مما أدى إلى أداء النموذج في التنبؤ بأفضل دقة بيانات تم الحصول عليها من نسبة 90:10 مما أدى إلى دقة 80٪ والتي تم تصنيفها على أنها كافية، وكانت ثبات مرضى السكري الإيجابي 88٪، وثبات مرضى السكري السلبي 73٪، وكان استدعاء مرضى السكري الإيجابي 74٪، واستدعاء مرضى السكري السلبي 87٪، وكانت درجة ف1 لمرضى السكري الإيجابي 80٪، ودرجة ف1 لمرضى السكري السلبي 79٪. وكذلك تطبيق تقنية التحقق المتقاطع K-Fold بقيمة k تساوي 10. تم الحصول على قيمة الدقة من عملية التكرار عشر مرات مما أدى إلى قيمة الدقة للتنبؤ المثلى للبيانات الناتجة عن قيمة k = 7 بقيمة 84.06٪.

Item Type: Thesis (Undergraduate)
Supervisor: Faisal, Muhammad and Suhartono, Suhartono
Keywords: Klasifikasi; Penyakit Diabetes; Naïve Bayes Classifier Classification; Diabetes; Naïve Bayes Classifier تصنيف; مرض سكري; مصنف بايزي ساذج.
Subjects: 17 PSYCHOLOGY AND COGNITIVE SCIENCES > 1702 Cognitive Sciences > 170203 Knowledge Representation and Machine Learning
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Denis Erlangga
Date Deposited: 23 Jul 2024 09:43
Last Modified: 31 Jul 2024 13:50
URI: http://etheses.uin-malang.ac.id/id/eprint/65226

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item