Prastyo, Edwin (2024) Deteksi berita hoax dengan pendekatan Lexicon Based dan LSTM. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
220605220005.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (3MB) |
Abstract
ABSTRAK
Di era digital, penyebaran berita hoaks menjadi isu yang signifikan, dengan dampak merugikan pada sosial, ekonomi, dan politik. Penelitian ini bertujuan untuk mengembangkan model deteksi berita hoaks menggunakan pendekatan hybrid berbasis leksikon dan Long Short-Term Memory (LSTM). Metode ini menggabungkan kekuatan leksikon dalam mengidentifikasi kata-kata kunci dengan kemampuan LSTM dalam menganalisis konteks dan pola teks secara mendalam. Hasil penelitian menunjukkan pendekatan hybrid ini efektif, dengan akurasi deteksi tertinggi mencapai 99%, terutama pada kategori berita politik. Pengaruh pengaturan hyperparameter, seperti "Max Features" 15,000 dan "Batch Size" 64, serta penggunaan optimizer ADAM, memberikan keseimbangan antara akurasi (0,9900) dan efisiensi waktu (209,24 detik). Namun, performa menurun pada berita olahraga, menyoroti pentingnya leksikon yang spesifik untuk tiap jenis konten. Penelitian ini memberikan kontribusi penting pada literatur deteksi hoaks dan merekomendasikan pengembangan aplikasi berbasis model ini untuk implementasi praktis, serta perluasan leksikon untuk meningkatkan akurasi lintas kategori konten.
ABSTRACT
In the digital era, the spread of fake news has become a significant issue, with adverse social, economic, and political impacts. This research aims to develop a hoax news detection model using a hybrid approach based on lexicon and Long Short-Term Memory (LSTM). This method combines the power of lexicon in identifying key words with the ability of LSTM in analysing text context and patterns in depth. The results show that this hybrid approach is effective, with the highest detection accuracy reaching 99%, especially in the political news category. The effect of hyperparameter settings, such as ‘Max Features’ 15,000 and ‘Batch Size’ 64, as well as the use of the ADAM optimiser, provides a balance between accuracy (0.9900) and time efficiency (209.24 seconds). However, performance degraded for sports news, highlighting the importance of a content-specific lexicon. This research makes an important contribution to the hoax detection literature and recommends developing applications based on this model for practical implementation, as well as expanding the lexicon to improve accuracy across content categories.
مستخلص البحث
إدوين، 2024. الكشف عن الأخبار الخادعة باستخدام النهج القائم على المعجم و lstm. أطروحة، برنامج دراسة الماجستير في المعلوماتية، كلية العلوم والتكنولوجيا، الجامعة الإسلامية الحكومية مولانا مالك إبراهيم مالانج. المشرف: (أولاً) الدكتور محمد فيصل، م. ت. (ثانيًا) الأستاذ الدكتور سوهارتونو، م. كوم.
في العصر الرقمي، أصبح انتشار الأخبار الكاذبة مشكلة كبيرة لها آثار اجتماعية واقتصادية وسياسية سلبية. يهدف هذا البحث إلى تطوير نموذج للكشف عن الأخبار الكاذبة باستخدام نهج هجين يعتمد على المعجم والذاكرة قصيرة المدى الطويلة (LSTM). وتجمع هذه الطريقة بين قوة المعجم في تحديد الكلمات الرئيسية وقدرة الذاكرة طويلة المدى على تحليل سياق النص وأنماطه بعمق. تُظهر النتائج أن هذا النهج الهجين فعّال، حيث وصلت أعلى دقة في الكشف إلى 99%، خاصة في فئة الأخبار السياسية. ويوفر تأثير إعدادات المعلمة الفائقة، مثل ”الحد الأقصى للميزات“ 15000 و”حجم الدُفعات“ 64، بالإضافة إلى استخدام مُحسِّن ADAM، توازنًا بين الدقة (0.9900) وكفاءة الوقت (209.24 ثانية). ومع ذلك، تدهور الأداء بالنسبة للأخبار الرياضية، مما يسلط الضوء على أهمية وجود معجم خاص بالمحتوى. يقدم هذا البحث مساهمة مهمة في أدبيات الكشف عن الخدع ويوصي بتطوير تطبيقات تستند إلى هذا النموذج للتطبيق العملي، بالإضافة إلى توسيع المعجم لتحسين الدقة عبر فئات المحتوى.
معجم، LSTM، معالجة اللغة الطبيعية
Item Type: | Thesis (Masters) |
---|---|
Supervisor: | Faisal, Suhartono and Totok, Ainul |
Keywords: | Deteksi Hoaks, Leksikon, LSTM, Pemrosesan Bahasa Alamo ; Hoax Detection, Lexicon, LSTM, Natural Language Processing;معجم، LSTM، معالجة اللغة الطبيعية; |
Subjects: | 01 MATHEMATICAL SCIENCES > 0199 Other Mathematical Sciences > 019999 Mathematical Sciences not elsewhere classified 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080108 Neural, Evolutionary and Fuzzy Computation 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080110 Simulation and Modelling |
Departement: | Fakultas Sains dan Teknologi > Jurusan Magister Tehnik Informatika |
Depositing User: | Edwin Hari Agus Prastyo |
Date Deposited: | 08 Jan 2025 10:57 |
Last Modified: | 08 Jan 2025 10:57 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/70637 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |