Wiyono, Masdar (2025) Klasifikasi kualitas perguruan tinggi di Indonesia menggunakan Random Forest dan Logistic Regression. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
20605220007.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (3MB) |
Abstract
ABSTRAK
Penelitian ini bertujuan untuk melakukan Klasifikasi Kualitas Perguruan Tinggi di Indonesia menggunakan Model Random Forest dan Logistic Regression. Data yang digunakan merupakan data sekunder yang telah diproses dan dibagi dalam beberapa rasio pelatihan dan pengujian. Hasil penelitian menunjukkan bahwa kedua Model memiliki performa yang kompetitif dengan keunggulan masing-masing. Model Logistic Regression terbaik (LR-C, rasio 70:30) mencapai akurasi 77,78% dengan nilai AUC tinggi di semua kelas mutu, sehingga cocok untuk analisis yang memerlukan interpretasi yang jelas. Sementara itu, Model Random Forest terbaik (RF-D, rasio 60:40) menunjukkan akurasi lebih tinggi, yaitu 81,25%, serta kemampuan yang baik dalam mengenali seluruh kategori mutu. Temuan ini menunjukkan bahwa kombinasi kedua Model dapat digunakan untuk meningkatkan ketepatan klasifikasi, dimana Logistic Regression efektif sebagai model dasar yang mudah dipahami, sedangkan Random Forest berperan sebagai model pendukung untuk validasi dan penguatan hasil. Penelitian ini masih memiliki keterbatasan, seperti penggunaan indikator administratif saja, distribusi kelas yang tidak seimbang, serta model yang belum adaptif terhadap perubahan mutu secara dinamis. Penelitian selanjutnya perlu melibatkan indikator yang lebih luas agar klasifikasi kualitas perguruan tinggi dapat dilakukan secara lebih komprehensif.
ABSTRACT
This study aims to classify the quality of higher education institutions in Indonesia using the Random Forest and Logistic Regression methods. The research utilizes secondary data that has been pre-processed and split into several training–testing ratios. The results show that both methods demonstrate competitive performance with their respective strengths. The best Logistic Regression model (LR-C, 70:30 ratio) achieved an accuracy of 77.78% with high AUC values across all quality categories, making it suitable for analyses requiring clear interpretability. Meanwhile, the best Random Forest model (RF-D, 60:40 ratio) achieved a higher accuracy of 81.25% and showed strong capability in identifying all quality categories. These findings indicate that combining both methods can enhance classification accuracy, where Logistic Regression serves effectively as an interpretable baseline model, while Random Forest provides additional support for validation and strengthening of results. This study has several limitations, including the use of administrative indicators only, imbalanced class distribution, and models that are not adaptive to dynamic quality changes. Future research should incorporate broader indicators to achieve a more comprehensive classification of higher education quality.
مستخلص البحث
يهدف هذا البحث إلى تصنيف جودة مؤسسات التعليم العالي في إندونيسيا باستخدام نموذجَي الغابة العشوائية و الانحدار اللوجستي. تعتمد البيانات المستخدمة على بيانات ثانوية تمت معالجتها وتقسيمها إلى عدة نسب للتدريب والاختبار. وتُظهر نتائج البحث أن النموذجين يمتلكان أداءً تنافسياً مع ميزات مميّزة لكل منهما. إذ حقق أفضل نموذج للانحدار اللوجستي (LR-C بنسبة 70:30) دقّة بلغت 77.78% مع قيمة AUC مرتفعة في جميع فئات الجودة، مما يجعله مناسباً للتحليلات التي تتطلب تفسيراً واضحاً. بينما أظهر أفضل نموذج للغابة العشوائية (RF-D بنسبة 60:40) دقّة أعلى بلغت 81.25%، إضافةً إلى قدرته الجيدة على التعرف على جميع فئات الجودة .تشير هذه النتائج إلى أن الجمع بين النموذجين يمكن أن يُستخدم لتحسين دقّة التصنيف، حيث يُعد الانحدار اللوجستي نموذجاً أساسياً فعّالاً وسهل الفهم، بينما تعمل الغابة العشوائية كنموذج داعم للتأكيد وتعزيز النتائج. ومع ذلك، ما يزال البحث يعاني من بعض القيود، مثل الاعتماد على مؤشرات إدارية فقط، وعدم توازن توزيع الفئات، فضلاً عن عدم قدرة النموذج على التكيف مع التغيرات الديناميكية في الجودة. وينبغي أن تتضمن الأبحاث المستقبلية مؤشرات أكثر شمولاً من أجل الحصول على تصنيف أكثر تكاملاً لجودة مؤسسات التعليم العالي.
| Item Type: | Thesis (Masters) |
|---|---|
| Supervisor: | Crysdian, Cahyo and Hariyadi, M. Amin |
| Keywords: | Klasifikasi Kualitas Perguruan Tinggi; Random Forest; Logistic Regression; Higher Education Quality Classification; Random Forest; Logistic Regression; تصنيف جودة مؤسسات التعليم العالي; الغابة العشوائية; الانحدار اللوجستي |
| Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining |
| Departement: | Fakultas Sains dan Teknologi > Jurusan Magister Tehnik Informatika |
| Depositing User: | Masdar Wiyono |
| Date Deposited: | 02 Dec 2025 10:38 |
| Last Modified: | 02 Dec 2025 10:38 |
| URI: | http://etheses.uin-malang.ac.id/id/eprint/81353 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |
