Responsive Banner

Pemetaan topik skripsi mahasiswa berbasis topic mining menggunakan Latent Dirichlet Allocation(LDA)

Albar, Ahmad Arsha (2026) Pemetaan topik skripsi mahasiswa berbasis topic mining menggunakan Latent Dirichlet Allocation(LDA). Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
210605110055.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(3MB) | Preview

Abstract

INDONESIA :

Pemilihan topik skripsi merupakan salah satu tahapan penting dalam penelitian mahasiswa, namun seringkali menjadi kendala karena keterbatasan referensi dan kecenderungan topik yang berulang. Kondisi tersebut dapat menyebabkan rendahnya variasi dan inovasi topik penelitian di lingkungan akademik. Oleh karena itu, diperlukan pendekatan yang mampu mengidentifikasi dan memetakan tren topik skripsi secara otomatis berdasarkan data skripsi yang telah tersedia. Penelitian ini bertujuan untuk mengidentifikasi dan memetakan tren topik skripsi mahasiswa menggunakan metode topic mining berbasis Latent Dirichlet Allocation (LDA). Data yang digunakan diperoleh dari repository e-theses UIN Maulana Malik Ibrahim Malang pada rentang tahun 2020–2025 dengan jumlah awal 3961 dokumen. Setelah melalui filter awal domain Teknik Informatika dan seleksi token TI, sebanyak 3349 dokumen atau 84,55% digunakan sebagai corpus final LDA, sedangkan 612 dokumen gugur karena tidak memenuhi kriteria seleksi. Pemodelan dilakukan menggunakan LDA dengan jumlah final 9 topik dan memperoleh nilai coherence score sebesar 0,429723. Hasil pemetaan bidang menunjukkan bahwa 2090 dokumen berhasil diklasifikasikan ke dalam enam bidang Teknik Informatika. Bidang paling dominan adalah Software Engineering sebanyak 583 dokumen atau 27,89%, diikuti oleh Intelligence System sebanyak 579 dokumen atau 27,70%, IoT & Robotic sebanyak 359 dokumen atau 17,18%, Multimedia & Game sebanyak 281 dokumen atau 13,44%, Sistem Informasi sebanyak 183 dokumen atau 8,76%, dan Web & Mobile Programming sebanyak 105 dokumen atau 5,02%. Hasil penelitian menunjukkan bahwa LDA mampu memberikan gambaran tren topik skripsi mahasiswa secara terstruktur dan dapat digunakan sebagai referensi dalam pemilihan topik skripsi yang lebih relevan.

ENGLISH:

The selection of a thesis topic is an important stage in student research, yet it often becomes a challenge due to limited references and the tendency of recurring topics. This condition may lead to low variation and innovation in academic research topics. Therefore, an approach is needed to automatically identify and map thesis topic trends based on existing thesis data. This study aims to identify and map student thesis topic trends using a topic mining method based on Latent Dirichlet Allocation (LDA). The data were obtained from the e-theses repository of UIN Maulana Malik Ibrahim Malang from 2020 to 2025, with an initial total of 3,961 documents. After applying the Informatics Engineering domain filter and TI token selection, 3,349 documents, or 84.55%, were used as the final LDA corpus, while 612 documents were excluded because they did not meet the selection criteria. The modeling process was conducted using LDA with a final number of 9 topics and obtained a coherence score of 0.429723. The field mapping results show that 2,090 documents were successfully classified into six Informatics Engineering fields. The most dominant field was Software Engineering with 583 documents, or 27.89%, followed by Intelligence System with 579 documents, or 27.70%, IoT & Robotic with 359 documents, or 17.18%, Multimedia & Game with 281 documents, or 13.44%, Information System with 183 documents, or 8.76%, and Web & Mobile Programming with 105 documents, or 5.02%. The results show that LDA is able to provide a structured overview of student thesis topic trends and can be used as a reference in selecting more relevant thesis topics.

ARABIC:

يُعَدُّ اختيارُ موضوعِ رسالةِ التخرّج من المراحلِ المهمّةِ في البحثِ العلميِّ لدى الطلّاب، إلّا أنّه غالبًا ما يُواجَه بعقباتٍ ناتجةٍ عن محدوديّةِ المراجع وتكرارِ الموضوعات المختارة، ممّا يؤدّي إلى انخفاضِ التنوّع والابتكار في موضوعاتِ الأبحاث داخل البيئة الأكاديميّة. لذلك، تبرز الحاجةُ إلى منهجيّةٍ قادرةٍ على تحديدِ اتّجاهات موضوعات الرسائل الجامعيّة وتصنيفِها بصورةٍ آليّة اعتمادًا على البيانات المتوفّرة مسبقًا. تهدفُ هذه الدراسةُ إلى تحديدِ وتحليلِ اتّجاهات موضوعات رسائل التخرّج لدى الطلّاب باستخدامِ أسلوبِ تنقيبِ الموضوعات القائم على نموذج «Latent Dirichlet Allocation (LDA)». تمّ الحصولُ على البيانات من مستودع الرسائل الإلكترونيّة بجامعة UIN Maulana Malik Ibrahim Malang خلال الفترة الممتدّة من ٢٠٢٠ إلى ٢٠٢٥، بعددٍ أوّلي بلغ ٣٩٦١ وثيقة. وبعد إجراءِ التصفية الأوّلية في مجال هندسة المعلوماتيّة واختيار الرموز الخاصّة بتقنيّة المعلومات، استُخدِمَت ٣٣٤٩ وثيقة، أي بنسبة ٨٤,٥٥٪، بوصفها corpus نهائيًّا لنموذج LDA ، في حين استُبعِدَت ٦١٢ وثيقة لعدم استيفائها معاييرَ الاختيار. أُجريَت عمليّةُ النمذجة باستخدام LDA مع اعتمادِ ٩ موضوعاتٍ نهائيّة، وحقّق النموذج قيمة coherence score بلغت ٠,٤٢٩٧٢٣. وأظهرت نتائجُ التصنيف أنّ ٢٠٩٠ وثيقةً قد صُنِّفَت ضمن ستّة مجالات في هندسة المعلوماتيّة، حيث كان مجالُ هندسة البرمجيّات الأكثرَ هيمنةً بعدد ٥٨٣ وثيقة بنسبة ٢٧,٨٩٪، يليه مجالُ الأنظمة الذكيّة بعدد ٥٧٩ وثيقة بنسبة ٢٧,٧٠٪، ثمّ إنترنت الأشياء والروبوتات بعدد ٣٥٩ وثيقة بنسبة ١٧,١٨٪، فالوسائط المتعدّدة والألعاب بعدد ٢٨١ وثيقة بنسبة ١٣,٤٤٪، ثمّ نظم المعلومات بعدد ١٨٣ وثيقة بنسبة ٨,٧٦٪، وأخيرًا برمجة الويب والهواتف المحمولة بعدد ١٠٥ وثائق بنسبة ٥,٠٢٪. وتُظهِر نتائجُ الدراسة أنّ نموذج LDA قادرٌ على تقديمِ تصوّرٍ منظّم لاتّجاهات موضوعات رسائل التخرّج لدى الطلّاب، ويمكن الاستفادةُ منه مرجعًا في اختيار موضوعاتٍ أكثرَ ملاءمةً وحداثةً.

Item Type: Thesis (Undergraduate)
Supervisor: Yaqin, Muhammad Ainul and Afrah, Ashri Shabrina
Keywords: Topic Mining;Latent Dirichlet Allocation (LDA);Text Mining;Coherence Score;Topic Mining;Latent Dirichlet Allocation (LDA);Text Mining;Coherence Score;تنقيب الموضوعات;التخصيص الديريشليه الكامن (LDA);تنقيب النصوص;درجة الاتساق
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0806 Information Systems > 080608 Information Systems Development Methodologies
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Ahmad Arsha Albar
Date Deposited: 20 May 2026 14:11
Last Modified: 20 May 2026 14:11
URI: http://etheses.uin-malang.ac.id/id/eprint/84652

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item