Subarkah, Aan Fuad (2023) Prediksi kelulusan mahasiswa berbasis klasifikasi Data Mining. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fullltext)
19841006.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) |
Abstract
ABSTRAK
Jumlah mahasiswa yang mendaftar di Universitas Islam Negeri Maulana Malik Ibrahim Malang terus meningkat, namun tidak semua mahasiswa dapat lulus tepat waktu sesuai dengan masa studi yang telah ditentukan, sehingga terjadi penumpukan mahasiswa yang belum lulus sesuai dengan periode kelulusan mereka. Salah satu aspek yang dievaluasi dalam proses akreditasi Program Studi adalah tingkat kelulusan mahasiswa. Selain itu, untuk setiap semester, Program Studi juga wajib melaporkan data pendidikan ke DIKTI, dan kelulusan mahasiswa menjadi salah satu faktor yang diperhitungkan dalam laporan tersebut. Terdapat ketidakseimbangan antara jumlah mahasiswa yang lulus setiap tahun dan jumlah mahasiswa baru yang diterima. Untuk mengatasi masalah ini, perlu dilakukan prediksi kelulusan mahasiswa agar dapat menentukan apakah mereka akan lulus tepat waktu. Dalam konteks ilmu pengetahuan dan analisis data, prediksi sering digunakan untuk membuat perkiraan tentang masa depan berdasarkan data dan informasi yang ada. Model klasifikasi dalam memprediksi kelulusan mahasiswa diantaranya metode Naive Bayes, Support Vector Machine SVM, dan Random Forest, serta seberapa besar tingkat akurasi dari ketiga metode tersebut. Dari hasil eksperimen dan evaluasi model yang dilakukan, dengan data mahasiswa Program Studi Teknik Informatika berjumlah 458 dengan pembagian data training dan data testing secara acak dengan beberapa percobaan diperoleh nilai akurasi rata-rata untuk model SVM memiliki akurasi tertinggi, mencapai 82% dan Random Forest juga memiliki akurasi yang baik yaitu 80% sedangkan model Naïve Bayes memiliki akurasi yang lebih rendah, yaitu 71%.
مستخلص البحث
كل عام، يزداد عدد الطلاب الذين يتم قبولهم في جامعة مولانا مالك إبراهيم الإسلامية الحكومية مالانج، ولكن بعض الطلاب لا يستطيعون التخرج في الوقت المحدد وفقًا لفترة الدراسة التي قرّرتها الجامعة، مما يؤدي إلى تراكم الطلاب الذين لم يتخرجوا وفقًا لمتطلباتهم الدراسية، بينما إحدى الجوانب التي يتم تقويمها في عملية الاعتماد الأكاديمي للبرنامج الدراسي هي معدل تخرج الطلاب. بالإضافة إلى ذلك، يجب على برنامج الدراسة في كل فصل دراسي أن يقدم تقارير بيانات التعليم إلى التعليم العالي، ويكون تخرج الطلاب عاملا من العوامل المحسوبة في هذا التقرير. يوجد هناك عدم التوازن بين عدد المتخرّجين والطلاب الجدد الّذين يتم قبولهم في كل عام. فلحلّ هذه المشكلة، تحتاج الجامعة إلى التنبؤات عن تخرج الطلاب لتحديد ما إذا كانوا سيتخرجون في الوقت المناسب. في سياق علم البيانات وتحليل البيانات، يُستخدم التنبؤ كثيرًا لعمل تقديرات حول المستقبل على أساس البيانات والمعلومات المتاحة. ومن نماذج التصنيفات المستخدمة في التنبؤ بتخرج الطلاب هي Naive Bayes، Support Vector Machine SVM، وRandom Forest، وما مدى مستوى دقة ثلاثة تلك الطرق. ومن بيانات نتائج التجارب وتقويم النماذج التي قامه الباحث هي: تمت باستخدام بيانات 458 طالبًا من برنامج دراسة الهندسة المعلوماتية، وتقسيمهم إلى بيانات تدريب واختبار بشكل عشوائي في عدة تجارب تبين أن نموذج SVM يحقق أعلى دقة، بلغت حوالي 82٪. بينما تظهر Random Forest أيضًا دقة جيدة تقدر بحوالي 80٪، في حين يظهر نموذج Naïve Bayes دقة أقل، تقدر بحوالي 71٪.
ABSTRACT
The number of students registering at the Maulana Malik Ibrahim State Islamic University of Malang continues to increase, but not all students can graduate on time according to the predetermined study period, resulting in a buildup of students who have not graduated according to their graduation period. One of the aspects evaluated in the Study Programme accreditation process is the student graduation rate. In addition, for each semester, the Study Programme is also required to report educational data to DIKTI, and student graduation is one of the factors taken into account in the report. There is an imbalance between the number of students who graduate each year and the number of new students admitted. To overcome this problem, it is necessary to predict student graduation in order to determine whether they will graduate on time. In the context of science and data analysis, prediction is often used to make estimates about the future based on existing data and information. Classification models in predicting student graduation include the Naive Bayes method, Support Vector Machine SVM, and Random Forest, and how much accuracy the three methods have. From the results of experiments and model evaluations carried out, with data from 458 students of the Informatics Engineering Study Program, by randomly dividing the training data and test data into several experiments, the average accuracy value of the SVM model was obtained which had the highest accuracy, reaching 82% and Random Forest also has good accuracy, namely 80%, while the Naïve Bayes model has lower accuracy, namely 71%.
Item Type: | Thesis (Masters) |
---|---|
Supervisor: | Kusumawati, Ririen and Imamudin, Mochamad |
Keywords: | lulus tepat waktu, model klasifikasi, naive bayes, svm, random forest, evaluasi model, akurasi تخرج في الوقت المناسب، نموذج التصنيف، naive bayes، SVM، random forest، تقويم النموذج، الدقة. graduate on time, classification model, naive bayes, svm, random forest, model evaluation, accuracy. |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining |
Departement: | Fakultas Sains dan Teknologi > Jurusan Magister Tehnik Informatika |
Depositing User: | Aan Fuad Subarkah |
Date Deposited: | 20 Dec 2023 14:46 |
Last Modified: | 20 Dec 2023 14:46 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/58744 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |