Rizky, Muhammad Azra Dwi (2025) Optimasi model Random Forest untuk deteksi penyakit gagal jantung dengan GridSearchCV. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
210605110097.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (2MB) |
Abstract
INDONESIA:
Penyakit gagal jantung merupakan salah satu penyebab utama kematian tertinggi di dunia, sehingga deteksi dini menjadi sangat diperlukan. Pada klasifikasi untuk bidang medis, algoritma Random Forest banyak digunakan karena kemampuannya dalam menangani data kompleks dan non-linear. Penelitian ini bertujuan untuk mengoptimasi model Random Forest dengan menggunakan GridsearchCV yang dapat meningkatkan kinerja model dengan mencari kombinasi hyperparameter terbaik. Dataset yang digunakan adalah Heart Failure Prediction Dataset dari Kaggle yang terdiri dari 918 data dan 11 fitur. Evaluasi dilakukan dengan membandingkan performa model sebelum dan sesudah optimasi pada beberapa skenario. Hasil penelitian menunjukkan bahwa optimasi GridsearchCV memberikan hasil yang beragam pada tiap skenario uji, dengan model terbaik adalah C2 – NE, yang menghasilkan akurasi 89%, presisi 89.5%, recall 89%, dan F1-score 89%, serta memberikan peningkatan performa sebesar 2% pada akurasi dan presisi, dan 2.5% pada recall dan F1-score dibandingkan model tanpa optimasi.
ENGLISH:
The role of the gaming industry is immense in today's economy by making important contributions to economic growth. According to Fortune Business Insights In 2023, the value of the global gaming market surpassed USD $200 billion, showing very strong growth exceeding many traditional entertainment sectors. User reviews are necessary for the continued growth of the gaming industry. However, while reviews provide many insights, their unstructured and subjective nature often poses a challenge for developers. The purpose of this research is to identify the main aspects of the game reviews which are divided into 3 main categories namely gameplay, Graphics, and Story from user reviews automatically using neural networks. Among the 5 models trained based on the test scenario, Model 4 with a training and testing data ratio of 60:40, a learning rate of 0,01, and an error tolerance of 1e-10 provides the best performance with an Accuracy percentage of 90% and an average percentage of precision 89%, recall 91%, F1-score 90%.
ARABIC:
يعد مرض قصور القلب أحد الأسباب الرئيسية للوفاة في العالم، مما يجعل الكشف المبكر عنه أمرًا لا غنى عنه. في التصنيف الطبي، تُستخدم خوارزمية الغابة العشوائية على نطاق واسع نظرًا لقدرتها على التعامل مع البيانات المعقدة وغير الخطية. تهدف هذه الدراسة إلى تحسين نموذج الغابة العشوائية باستخدام GridsearchCV الذي يمكنه تحسين أداء النموذج من خلال إيجاد أفضل مجموعة من المعلمات الفائقة. مجموعة البيانات المستخدمة هي مجموعة بيانات التنبؤ بقصور القلب من Kaggle والتي تتكون من 918 بيانات و11 سمة. تم إجراء التقييم من خلال مقارنة أداء النموذج قبل التحسين وبعده في عدة سيناريوهات. أظهرت النتائج أن تحسين GridsearchCV أعطى نتائج متباينة في كل سيناريو اختبار، حيث كان أفضل نموذج هو C2 - NE، والذي أدى إلى دقة 89% ودقة 89.5% واستدعاء 89% و89% من التذكر و89% من درجة F1، وقدم تحسينًا في الأداء بنسبة 2% في الدقة والدقة و2.5% في التذكر ودرجة F1 مقارنة بالنموذج بدون تحسين
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Lestari, Tri Mukti and Holle, Khadijah Fahmi Hayati |
Keywords: | Deteksi gagal jantung; Random Forest; GridsearchCV; optimasi hyperparameter; Heart failure detection; Random Forest; GridSearchCV; hyperparameter optimization; اكتشاف فشل القلب; غابة القرار; GridSearchCV; تحسين معاملات النموذج |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Muhammad Azra Dwi Rizky |
Date Deposited: | 22 Jul 2025 10:55 |
Last Modified: | 22 Jul 2025 10:55 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/80449 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |