Responsive Banner

Implementasi algoritma nu-support vector machine pada model klasifikasi sekuens DNA manusia: studi kasus penderita diabetes mellitus

Nuha, Muhammad Fathun (2024) Implementasi algoritma nu-support vector machine pada model klasifikasi sekuens DNA manusia: studi kasus penderita diabetes mellitus. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
200601110106.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB)

Abstract

INDONESIA:

Perkembangan teknologi machine learning telah memungkinkan proses analisis data yang lebih kompleks dan akurat dalam bidang kesehatan dan diagnosa penyakit seperti diabetes mellitus. Penelitian ini bertujuan untuk mengimplementasikan algoritma nu-Support Vector Machine (nu-SVM) pada pembuatan model klasifikasi sekuens DNA manusia sehingga dapat mengidentifikasi penderita diabetes mellitus. Data sekuens DNA yang digunakan dalam penelitian ini merupakan data DNA dari manusia yang menderita diabetes melitus dan non-diabetes sebanyak 2509 data. Data tersebut diolah melalui tahapan preprocessing yang mencakup tahap cleaning data DNA, k-mers encoding, transformasi CountVectorizer, dan oversampling menggunakan SMOTE. Pembuatan model klasifikasi dilakukan menggunakan algoritma nu-SVM, dan dievaluasi menggunakan Stratified K-Fold Cross-Validation untuk mengetahui performa model. Hasilnya, Implementasi nu-SVM pada model klasifikasi sekuens DNA menghasilkan akurasi rata-rata sebesar 90%, presisi rata-rata sebesar 90,18%, serta recall dan F1-score rata-rata sebesar 90%. Hasil ini menunjukkan jika algoritma nu-SVM terbukti mampu mengidentifikasi sekuens DNA manusia dengan cepat dan akurat sehingga mampu memberikan kontribusi terhadap pengembangan sistem diagnosis dini penyakit yang lebih efektif dan efisien.

ENGLISH:

The development of machine learning technology has enabled more complex and accurate data analysis processes in the field of health and diagnosis of diseases such as diabetes mellitus. This research aims to implement the nu-Support Vector Machine (nu-SVM) algorithm in human DNA sequence classification modeling so as to identify people with diabetes mellitus. The DNA sequence data used in this research are 2509 human DNA data consist of those human DNA which are indicated with diabetes mellitus and those which are not. The data is processed through preprocessing stages which include cleaning DNA data, k-mers encoding, CountVectorizer transformation, and oversampling using SMOTE. Classification modeling was performed using the nu-SVM algorithm, and evaluated using Stratified K-Fold Cross Validation to determine model performance. As a result, the implementation of nu-SVM in the DNA sequence classification model resulted in an average accuracy of 90%, an average precision of 90.18%, and an average recall and F1-score of 90%. These results show that the nu-SVM algorithm is proven to be able to identify human DNA sequences accurately so that it can contribute to the development of a more effective and efficient disease early diagnosis system.

ARABIC:

لقد اتاح تطور تكنولو جية التعلم الالي لاجراء عمليات تحليل البيانات اكثر تعقيدا ودقة في مجال الصحة وتشخيص الامراض مثل داء السكري الميليتوس، يهدف هذا البحث الى تطبيق خوارزمية الة ناقل الدعم النانوي (nu-SVM) ان بيانات تسلسل، الحمض النووى، المستخدمة فى هذه الدراسة هي بيانات بشرية تعانى من داء السكري بقدر ٢٥٠٩ بيانات. تمت معالجة البيانات من خلال مرحلة المعالجة المسبقة التى تضمنت تنظيف بيانات الحمض النووي وترميز ( k-mers) وتحويل ناقل العد، واخذ عينات زائدة باستخدام (SMOTE) يتم اجراء نمذجة التصنيف باستخدام خوارزمية (nu-SVM)، ويتم تقييمها باستخدام التحقق المقاطع الطبقلى (K-Fold Cross Validation) لتحديد اداء النموذج. نتح عن تطبيق خوارزمية (nu-SVM) على النموذج تضيف تسلسل الحمض النووي متوسط دقة بنسبة 90%، ومتوسط دقة بنسبة 90,18%، ومتوسط استرجاع ودرجة (F1) بنسبة 90%. تظهر هذه النتائج ان خوارزمية (nu-SVM) اثبتت قدرتها على تحديد تسلسل الحمض النووي البشرى بسرعة ودقة حتى نتمكن من المساهمة فى تطوير نظام اكثر فعالية وكفاءة للتشحيص المبكر للامراض.

Item Type: Thesis (Undergraduate)
Supervisor: Kusumastuti, Ari and Jauhari, Mohammad Nafie
Keywords: Bioinformatika; Diabetes Mellitus; Klasifikasi DNA; Machine Learning; nu-Support Vector Machine; Bioinformatics; Diabetes Mellitus; DNA Classification; Machine Learning; nu-Support Vector Machine; خوارزمية آلة ناقل الدعم نو، تصنيف الحمض النوو، داء السكرى، التعلم الآلي بيونيفارماتيك.
Departement: Fakultas Sains dan Teknologi > Jurusan Matematika
Depositing User: Muhammad Fathun Nuha
Date Deposited: 12 Nov 2024 09:12
Last Modified: 12 Nov 2024 09:12
URI: http://etheses.uin-malang.ac.id/id/eprint/70132

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item