Responsive Banner

Analisis pengaruh seleksi fitur ANOVA terhadap performa model klasifikasi Gaussian Naive Bayes pada dataset Pima Indians Diabetes

Kurniawan, Fahriza (2023) Analisis pengaruh seleksi fitur ANOVA terhadap performa model klasifikasi Gaussian Naive Bayes pada dataset Pima Indians Diabetes. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
18650080.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (3MB) | Preview

Abstract

INDONESIA:

Penelitian ini bertujuan untuk menganalisis pengaruh seleksi fitur ANOVA terhadap performa model klasifikasi Gaussian Naïve Bayes pada dataset Pima Indians Diabetes. Diabetes merupakan masalah kesehatan global yang mempengaruhi jutaan orang di seluruh dunia. Dalam upaya untuk mengidentifikasi faktor risiko yang berkontribusi terhadap diabetes mellitus, analisis data dan pemodelan klasifikasi dapat membantu dalam memprediksi kemungkinan seseorang mengalami kondisi ini. Hasil penelitian menunjukkan bahwa seleksi fitur ANOVA memiliki pengaruh signifikan terhadap performa model klasifikasi Gaussian Naïve Bayes pada dataset Pima Indians Diabetes. Dengan memilih fitur-fitur yang paling informatif, model klasifikasi dapat meningkatkan kemampuan prediksi diabetes dengan meningkatkan akurasi dan metrik evaluasi lainnya. Dengan akurasi sebesar 86,0%, model yang hanya menggunakan lima fitur terbaik ini mampu mengklasifikasikan data dengan tingkat akurasi yang lebih tinggi dibandingkan model lainnya.

ENGLISH:

The purpose of this research is to analyze the influence of ANOVA feature selection on the performance of the Gaussian Naïve Bayes classification model on the Pima Indians Diabetes dataset. Diabetes is a global health problem that affects millions of people worldwide. In an effort to identify risk factors that contribute to diabetes mellitus, data analysis and classification modeling can help predict the likelihood of someone experiencing this condition. The research results indicate that ANOVA feature selection has a significant influence on the performance of the Gaussian Naïve Bayes classification model on the Pima Indians Diabetes dataset. By selecting the most informative features, the classification model can improve the ability to predict diabetes by increasing accuracy and other evaluation metrics. With an accuracy of 86.0%, the model that uses only the top five features is able to classify data with a higher accuracy rate compared to other models.

ARABIC:

يهدف هذا البحث إلى تحليل تأثير اختيار ميزة ANOVA على أداء نموذج تصنيف البايزي الساذج (Gaussian Naïve Bayes) في مجموعة بيانات Pima Indians Diabetes. مرض السكري هو مشكلة صحية عالمية تؤثر على الملايين من الناس في جميع أنحاء العالم. في محاولة لتحديد عوامل الخطر التي تساهم في مرض السكري، يمكن أن يساعد تحليل البيانات ونمذجة التصنيف في التنبؤ باحتمالية إصابة الشخص بهذه الحالة. أظهرت النتائج أن اختيار ميزة ANOVA كان له تأثير كبير على أداء نموذج تصنيف البايزي الساذج في مجموعة بيانات Pima Indians Diabetes. من خلال اختيار الميزات الأكثر إفادة، يمكن لنماذج التصنيف تحسين القدرات التنبئية لمرض السكري من خلال تحسين الدقة ومقاييس التقييم الأخرى. بدقة ٨٦.٠%، فإن النموذج الذي يستخدم أفضل خمس ميزات فقط قادر على تصنيف البيانات بمستوى أعلى من الدقة من الطرز الأخرى

Item Type: Thesis (Undergraduate)
Supervisor: Suhartono, Suhartono and Imamudin, Mochamad
Keywords: Gaussian Naïve Bayes; Diabetes Mellitus; Seleksi Fitur; ANOVA; Gaussian Naïve Bayes; Diabetes Mellitus; Feature Selection; ANOVA; بايزي ساذج، داء السكري، اختيار الميزة، ANOVA.
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Fahriza Kurniawan
Date Deposited: 19 Feb 2024 13:27
Last Modified: 19 Feb 2024 13:27
URI: http://etheses.uin-malang.ac.id/id/eprint/59230

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item