Anabila, Qonita Nashifa (2025) Deteksi hoaks untuk postingan artikel tulisan berbahasa Indonesia berbasis topik modelling menggunakan algoritma random forest. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
220605110135.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (9MB) |
Abstract
INDONESIA:
Penyebaran hoaks di media sosial Indonesia mengancam stabilitas informasi publik. Penelitian ini mengembangkan sistem deteksi hoaks pada artikel berbahasa Indonesia menggunakan algoritma Random Forest dengan pendekatan topik modelling. Dataset berjumlah 733 postingan diklasifikasikan berdasarkan dua aspek: pendidikan, politik. Penelitian membandingkan pendekatan singlestage dan multistage classification dengan data seimbang. Hasil menunjukkan singlestage classification mencapai akurasi 70,75%, sedangkan multistage menghasilkan performa end-to-end 46,77% akibat propagasi kesalahan antar tahap. Kombinasi ekstraksi fitur Bag-of-Words dengan parameter n_estimators 50-100 dan max_depth 10-30 memberikan performa optimal. Penelitian ini berkontribusi pada pengembangan sistem deteksi hoaks yang adaptif terhadap karakteristik bahasa Indonesia.
ENGLISH:
The spread of hoaxes on Indonesian social media threatens public information stability. This research develops a hoax detection system for Indonesian-language articles using Random Forest algorithm with topic modelling approach. A dataset of 733 posts was classified based on two aspects: education and politics. The study compared single-stage and multistage classification approaches with balanced data. Results show singlestage classification achieved 70.75% accuracy, while multistage yielded 46.77% end-to-end performance due to error propagation between stages. The combination of Bag-of-Words feature extraction with n_estimators parameters of 50-100 and max_depth of 10-30 provided optimal performance. This research contributes to developing hoax detection systems adaptive to Indonesian language characteristics.
ARABIC:
يهدد انتشار الأخبار الزائفة على وسائل التواصل الاجتماعي الإندونيسية استقرار المعلومات العامة. يطور هذا البحث نظام كشف الأخبار الزائفة للمقالات باللغة الإندونيسية باستخدام خوارزمية الغابة العشوائية مع نهج نمذجة الموضوعات. صُنفت مجموعة بيانات مكونة من ٧٣٣ منشورًا بناءً على جانبين: التعليم والسياسة. قارن البحث بين نهج التصنيف أحادي المرحلة ومتعدد المراحل مع بيانات متوازنة. أظهرت النتائج أن التصنيف أحادي المرحلة حقق دقة ٧٠،٧٥٪، بينما حقق التصنيف متعدد المراحل أداءً شاملاً ٤٦،٧٧٪ بسبب انتشار الأخطاء بين المراحل. وفر الجمع بين استخراج ميزات كيس الكلمات مع معاملات n_estimators من ٥٠-١٠٠ و max_depth من ١٠-٣٠ أداءً مثاليًا. يساهم هذا البحث في تطوير أنظمة كشف الأخبار الزائفة التي تتكيف مع خصائص اللغة الإندونيسية.
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |
