Responsive Banner

Deteksi berita hoax dengan pendekatan Lexicon Based dan LSTM

Prastyo, Edwin (2024) Deteksi berita hoax dengan pendekatan Lexicon Based dan LSTM. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
220605220005.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (3MB)

Abstract

ABSTRAK

Di era digital, penyebaran berita hoaks menjadi isu yang signifikan, dengan dampak merugikan pada sosial, ekonomi, dan politik. Penelitian ini bertujuan untuk mengembangkan model deteksi berita hoaks menggunakan pendekatan hybrid berbasis leksikon dan Long Short-Term Memory (LSTM). Metode ini menggabungkan kekuatan leksikon dalam mengidentifikasi kata-kata kunci dengan kemampuan LSTM dalam menganalisis konteks dan pola teks secara mendalam. Hasil penelitian menunjukkan pendekatan hybrid ini efektif, dengan akurasi deteksi tertinggi mencapai 99%, terutama pada kategori berita politik. Pengaruh pengaturan hyperparameter, seperti "Max Features" 15,000 dan "Batch Size" 64, serta penggunaan optimizer ADAM, memberikan keseimbangan antara akurasi (0,9900) dan efisiensi waktu (209,24 detik). Namun, performa menurun pada berita olahraga, menyoroti pentingnya leksikon yang spesifik untuk tiap jenis konten. Penelitian ini memberikan kontribusi penting pada literatur deteksi hoaks dan merekomendasikan pengembangan aplikasi berbasis model ini untuk implementasi praktis, serta perluasan leksikon untuk meningkatkan akurasi lintas kategori konten.

ABSTRACT

In the digital era, the spread of fake news has become a significant issue, with adverse social, economic, and political impacts. This research aims to develop a hoax news detection model using a hybrid approach based on lexicon and Long Short-Term Memory (LSTM). This method combines the power of lexicon in identifying key words with the ability of LSTM in analysing text context and patterns in depth. The results show that this hybrid approach is effective, with the highest detection accuracy reaching 99%, especially in the political news category. The effect of hyperparameter settings, such as ‘Max Features’ 15,000 and ‘Batch Size’ 64, as well as the use of the ADAM optimiser, provides a balance between accuracy (0.9900) and time efficiency (209.24 seconds). However, performance degraded for sports news, highlighting the importance of a content-specific lexicon. This research makes an important contribution to the hoax detection literature and recommends developing applications based on this model for practical implementation, as well as expanding the lexicon to improve accuracy across content categories.

مستخلص البحث

إدوين، 2024. الكشف عن الأخبار الخادعة باستخدام النهج القائم على المعجم و lstm. أطروحة، برنامج دراسة الماجستير في المعلوماتية، كلية العلوم والتكنولوجيا، الجامعة الإسلامية الحكومية مولانا مالك إبراهيم مالانج. المشرف: (أولاً) الدكتور محمد فيصل، م. ت. (ثانيًا) الأستاذ الدكتور سوهارتونو، م. كوم.
في العصر الرقمي، أصبح انتشار الأخبار الكاذبة مشكلة كبيرة لها آثار اجتماعية واقتصادية وسياسية سلبية. يهدف هذا البحث إلى تطوير نموذج للكشف عن الأخبار الكاذبة باستخدام نهج هجين يعتمد على المعجم والذاكرة قصيرة المدى الطويلة (LSTM). وتجمع هذه الطريقة بين قوة المعجم في تحديد الكلمات الرئيسية وقدرة الذاكرة طويلة المدى على تحليل سياق النص وأنماطه بعمق. تُظهر النتائج أن هذا النهج الهجين فعّال، حيث وصلت أعلى دقة في الكشف إلى 99%، خاصة في فئة الأخبار السياسية. ويوفر تأثير إعدادات المعلمة الفائقة، مثل ”الحد الأقصى للميزات“ 15000 و”حجم الدُفعات“ 64، بالإضافة إلى استخدام مُحسِّن ADAM، توازنًا بين الدقة (0.9900) وكفاءة الوقت (209.24 ثانية). ومع ذلك، تدهور الأداء بالنسبة للأخبار الرياضية، مما يسلط الضوء على أهمية وجود معجم خاص بالمحتوى. يقدم هذا البحث مساهمة مهمة في أدبيات الكشف عن الخدع ويوصي بتطوير تطبيقات تستند إلى هذا النموذج للتطبيق العملي، بالإضافة إلى توسيع المعجم لتحسين الدقة عبر فئات المحتوى.

معجم، LSTM، معالجة اللغة الطبيعية

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item