Responsive Banner

Deteksi hoaks untuk postingan artikel tulisan berbahasa Indonesia berbasis topik modelling menggunakan algoritma random forest

Anabila, Qonita Nashifa (2025) Deteksi hoaks untuk postingan artikel tulisan berbahasa Indonesia berbasis topik modelling menggunakan algoritma random forest. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
220605110135.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(9MB)

Abstract

INDONESIA:

Penyebaran hoaks di media sosial Indonesia mengancam stabilitas informasi publik. Penelitian ini mengembangkan sistem deteksi hoaks pada artikel berbahasa Indonesia menggunakan algoritma Random Forest dengan pendekatan topik modelling. Dataset berjumlah 733 postingan diklasifikasikan berdasarkan dua aspek: pendidikan, politik. Penelitian membandingkan pendekatan singlestage dan multistage classification dengan data seimbang. Hasil menunjukkan singlestage classification mencapai akurasi 70,75%, sedangkan multistage menghasilkan performa end-to-end 46,77% akibat propagasi kesalahan antar tahap. Kombinasi ekstraksi fitur Bag-of-Words dengan parameter n_estimators 50-100 dan max_depth 10-30 memberikan performa optimal. Penelitian ini berkontribusi pada pengembangan sistem deteksi hoaks yang adaptif terhadap karakteristik bahasa Indonesia.

ENGLISH:

The spread of hoaxes on Indonesian social media threatens public information stability. This research develops a hoax detection system for Indonesian-language articles using Random Forest algorithm with topic modelling approach. A dataset of 733 posts was classified based on two aspects: education and politics. The study compared single-stage and multistage classification approaches with balanced data. Results show singlestage classification achieved 70.75% accuracy, while multistage yielded 46.77% end-to-end performance due to error propagation between stages. The combination of Bag-of-Words feature extraction with n_estimators parameters of 50-100 and max_depth of 10-30 provided optimal performance. This research contributes to developing hoax detection systems adaptive to Indonesian language characteristics.

ARABIC:

يهدد انتشار الأخبار الزائفة على وسائل التواصل الاجتماعي الإندونيسية استقرار المعلومات العامة. يطور هذا البحث نظام كشف الأخبار الزائفة للمقالات باللغة الإندونيسية باستخدام خوارزمية الغابة العشوائية مع نهج نمذجة الموضوعات. صُنفت مجموعة بيانات مكونة من ٧٣٣ منشورًا بناءً على جانبين: التعليم والسياسة. قارن البحث بين نهج التصنيف أحادي المرحلة ومتعدد المراحل مع بيانات متوازنة. أظهرت النتائج أن التصنيف أحادي المرحلة حقق دقة ٧٠،٧٥٪، بينما حقق التصنيف متعدد المراحل أداءً شاملاً ٤٦،٧٧٪ بسبب انتشار الأخطاء بين المراحل. وفر الجمع بين استخراج ميزات كيس الكلمات مع معاملات n_estimators من ٥٠-١٠٠ و max_depth من ١٠-٣٠ أداءً مثاليًا. يساهم هذا البحث في تطوير أنظمة كشف الأخبار الزائفة التي تتكيف مع خصائص اللغة الإندونيسية.

Item Type: Thesis (Undergraduate)
Supervisor: Aziz, Okta Qomaruddin and Crysdian, Cahyo
Keywords: Deteksi Hoaks; Random Forest; Topic Modelling; Multistage Classification; Bag-of-Words;Hoax Detection; Random Forest; Topic Modelling; Multistage Classification; Bag-of-Words;كشف الأخبار الزائفة; الغابة العشوائية، نمذجة الموضوعات; التصنيف متعدد المراحل; كيس الكلمات
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing
08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining
10 TECHNOLOGY > 1005 Communications Technologies > 100504 Data Communications
20 LANGUAGE, COMMUNICATION AND CULTURE > 2001 Communication and Media Studies > 200102 Communication Technology and Digital Media Studies
20 LANGUAGE, COMMUNICATION AND CULTURE > 2001 Communication and Media Studies > 200104 Media Studies
20 LANGUAGE, COMMUNICATION AND CULTURE > 2001 Communication and Media Studies > 200199 Communication and Media Studies not elsewhere classified
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Qonita Nashifa Anabila
Date Deposited: 07 Jan 2026 07:17
Last Modified: 07 Jan 2026 07:17
URI: http://etheses.uin-malang.ac.id/id/eprint/83125

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item