Responsive Banner

Implementasi algoritma support vector machine pada model klasifikasi sekuens DNA manusia: studi kasus penderita diabetes mellitus

Akmal, Muhammad Wildan Nuril (2024) Implementasi algoritma support vector machine pada model klasifikasi sekuens DNA manusia: studi kasus penderita diabetes mellitus. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Full Text)
210601110096.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB) | Preview

Abstract

INDONESIA:

Diabetes Mellitus adalah penyakit kronis yang kompleks dan memberikan dampak signifikan pada kesehatan masyarakat. Penelitian ini bertujuan untuk menerapkan algoritma Support Vector Machine (SVM) dalam klasifikasi sekuens DNA manusia untuk mengidentifikasi hubungan antara variasi genetik dengan diabetes mellitus. Tahapan preprocessing data meliputi pembersihan data untuk menghilangkan komponen yang tidak relevan, ekstraksi fitur melalui representasi k-mers, tokenisasi untuk mengkonversi sekuens DNA menjadi format numerik, serta oversampling untuk mengatasi ketidakseimbangan kelas pada dataset. Penelitian ini menggunakan SVM dengan kernel non-linear Radial Basis Function (RBF), di mana model yang dikembangkan berhasil mencapai akurasi maksimum sebesar 94% dalam membedakan tipe diabetes, yaitu Diabetes Mellitus Tipe 1, Tipe 2, dan non-diabetes. Studi ini memberikan kontribusi penting dalam penerapan pembelajaran mesin untuk analisis data genomik, serta mendukung inovasi dalam deteksi dini dan pengobatan diabetes yang terpersonalisasi.

ENGLISH:

Diabetes mellitus is a complex chronic disease that significantly impacts public health. This study aims to apply the Support Vector Machine (SVM) algorithm to classify human DNA sequences and identify the relationship between genetic variations and diabetes mellitus. The data preprocessing stages include data cleaning to remove irrelevant components, feature extraction using k-mer representation, tokenization to convert DNA sequences into numerical format, and oversampling to address class imbalance in the dataset. The study employed SVM with a non-linear Radial Basis Function (RBF) kernel, achieving a maximum accuracy of 94% in differentiating between diabetes types: Type 1, Type 2, and non-diabetes. This research contributes significantly to the application of machine learning in genomic data analysis and supports innovation in the early detection and personalized treatment of diabetes.

ARABIC:

داء السكري هو مرض مزمن معقد له تأثير كبير على الصحة العامة. تهدف هذه الدراسة إلى تطبيق خوارزمية آلة دعم المتجهات (SVM) في تصنيف تسلسلات الحمض النووي البشري لتحديد العلاقة بين التباين الجيني وداء السكري. وتتضمن مراحل المعالجة المسبقة للبيانات تنظيف البيانات لإزالة المكونات غير ذات الصلة، واستخراج السمات من خلال تمثيل k-mers، والترميز لتحويل تسلسل الحمض النووي إلى صيغة رقمية، وأخذ عينات زائدة لمعالجة عدم توازن الفئات في مجموعة البيانات. استخدمت هذه الدراسة نموذج SVM مع نواة الدالة القاعدية الشعاعية غير الخطية (RBF)، حيث حقق النموذج المطور دقة قصوى بلغت 94% في التفريق بين أنواع مرض السكري، وهي النوع الأول والنوع الثاني وغير السكري. تقدم هذه الدراسة مساهمة مهمة في تطبيق التعلم الآلي لتحليل البيانات الجينومية، وتدعم الابتكار في الكشف المبكر والعلاج الشخصي لمرض السكري.

Item Type: Thesis (Undergraduate)
Supervisor: Kusumastuti, Ari and Jauhari, Mohammad Nafie
Keywords: SVM; DNA; Diabetes Mellitus; Klasifikasi; Kernel RBF VM; DNA; Diabetes Mellitus; Classification; RBF Kernel. :آلة دعم المتجهات المساندة، الحمض النووي، داء السكري، التصنيف، الدالة األساسية الشعاعية النواة
Subjects: 01 MATHEMATICAL SCIENCES > 0102 Applied Mathematics > 010299 Applied Mathematics not elsewhere classified
Departement: Fakultas Sains dan Teknologi > Jurusan Matematika
Depositing User: Muhammad Wildan Nuril Akmal
Date Deposited: 09 Jan 2025 13:34
Last Modified: 09 Jan 2025 13:34
URI: http://etheses.uin-malang.ac.id/id/eprint/71223

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item