Responsive Banner

Implementasi algoritma random forest pada model klasifikasi sekuens DNA manusia dalam penyakit diabetes

Cholil, Moh Nurul (2025) Implementasi algoritma random forest pada model klasifikasi sekuens DNA manusia dalam penyakit diabetes. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
210601110048.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(4MB)

Abstract

INDONESIA:
Penelitian ini membahas tentang kalsifikasi sekuens DNA diabetes mellitus dalam machine learning berguna untuk mendeteksi pola penyakit. Dataset yang digunakan berasal dari sekuens gen insulin, yaitu protein penting yang diproduksi tubuh manusia untuk mengatur kadar glukosa darah yang dapat memicu diabetes melitus. Dalam penelitian ini, model klasifikasi dibangun menggunakan algoritma Random Forest, yang dikenal mampu menangani data dengan jumlah fitur besar serta menghasilkan performa yang stabil. Hasil evaluasi menunjukkan bahwa model mencapai akurasi optimal sebesar 93%, dengan menggunakan representasi 3-mers, proporsi data uji sebesar 20%, serta 100 pohon keputusan. Model ini berhasil membedakan dengan baik antara diabetes melitus tipe 1, tipe 2, serta kondisi non-diabetes. Kontribusi utama penelitian ini adalah pengembangan metode prediksi berbasis sekuens DNA yang dapat dimanfaatkan sebagai alat bantu untuk deteksi dini dan penanganan diabetes melitus. Dengan akurasi yang tinggi, model yang dihasilkan berpotensi diterapkan dalam praktik klinis guna meningkatkan kualitas diagnosis dan mendukung perencanaan pengobatan pasien.

ENGLISH:
This study discusses the classification of DNA sequences related to diabetes mellitus using machine learning to help detect disease patterns. The dataset used comes from the insulin gene sequence, which is an important protein produced by the human body to regulate blood glucose levels, where disruption of this function can trigger diabetes mellitus. In this research, the classification model was built using the Random Forest algorithm, which is known for its ability to handle large numbers of features and produce stable performance. The evaluation results showed that the model achieved an optimal accuracy of 93%, using 3-mer representations, 20% test data, and 100 decision trees. The model successfully distinguished between type 1 diabetes, type 2 diabetes, and non-diabetic conditions. The main contribution of this study is the development of a DNA sequence-based prediction method that can be used as a tool to assist in the early detection and treatment of diabetes mellitus. With its high accuracy, the resulting model has the potential to be applied in clinical practice to improve diagnostic quality and support patient treatment planning.

ARABIC:
تناقش هذه الدراسة تصنيف تسلسلات الحمض النووي المرتبطة بمرض السكري باستخدام التعلم الآلي للمساعدة في الكشف عن أنماط المرض. وتأتي مجموعة البيانات المستخدمة من تسلسل جين الأنسولين، وهو بروتين مهم ينتجه جسم الإنسان لتنظيم مستويات الجلوكوز في الدم، حيث يمكن أن يؤدي تعطيل هذه الوظيفة إلى الإصابة بمرض السكري. تم في هذا البحث بناء نموذج التصنيف باستخدام خوارزمية الغابة العشوائية المعروفة بقدرتها على التعامل مع أعداد كبيرة من الميزات وإنتاج أداء مستقر. وأظهرت نتائج التقييم أن النموذج حقق دقة مثالية بلغت ٩٣٪، باستخدام تمثيلات مير-٣، وبيانات اختبار ٢٠٪، و١٠٠ شجرة قرار. نجح النموذج في التمييز بين مرض السكري من النوع الأول، ومرض السكري من النوع الثاني، والحالات غير السكرية. المساهمة الرئيسية لهذه الدراسة هي تطوير طريقة التنبؤ القائمة على تسلسل الحمض النووي والتي يمكن استخدامها كأداة للمساعدة في الكشف المبكر عن مرض السكري وعلاجه. بفضل دقته العالية، يتمتع النموذج الناتج بالقدرة على التطبيق في الممارسة السريرية لتحسين جودة التشخيص ودعم تخطيط علاج المريض.

Item Type: Thesis (Undergraduate)
Supervisor: Kusumastuti, Ari and Alisah, Evawati
Keywords: random forest; sekuens dna; diabetes mellitus; random forest; dna sequence; diabetes mellitus; الغابة العشوائية؛ تسلسل الحمض النووي؛ مرض السكري
Departement: Fakultas Sains dan Teknologi > Jurusan Matematika
Depositing User: Moh Nurul Cholil
Date Deposited: 09 Jul 2025 14:48
Last Modified: 09 Jul 2025 14:48
URI: http://etheses.uin-malang.ac.id/id/eprint/76114

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item