Responsive Banner

Implementasi model Long Short-Term Memory (LSTM) untuk klasifikasi multi-label ujaran kebencian pada tweet bahasa Indonesia

Firna, Firna (2026) Implementasi model Long Short-Term Memory (LSTM) untuk klasifikasi multi-label ujaran kebencian pada tweet bahasa Indonesia. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
220605110017.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(16MB)

Abstract

INDONESIA:

Ujaran kebencian di media sosial merupakan permasalahan serius yang berdampak pada kenyamanan dan keharmonisan interaksi daring, khususnya pada platform seperti Twitter. Penelitian ini bertujuan mengklasifikasikan ujaran kebencian secara Multi-Label pada tweet berbahasa Indonesia menggunakan model Long Short-Term Memory (LSTM). Dataset diproses melalui tahapan praproses teks dan direpresentasikan menggunakan word2vec berbasis metode Skip-Gram, kemudian diuji melalui 24 skenario dengan variasi dimensi embedding, jumlah unit LSTM, batch size, dan nilai threshold. Performa model diukur menggunakan subset accuracy, hamming loss, macro precision, macro recall, dan macro F1-score. Hasil penelitian menunjukkan bahwa threshold memiliki pengaruh paling signifikan terhadap keseimbangan performa, di mana nilai yang lebih tinggi meningkatkan precision dan subset accuracy serta menurunkan hamming loss. Konfigurasi terbaik diperoleh pada Skenario 18 (100d–64H–64B–0.3t) dengan subset accuracy 52,16%, hamming loss 17,15%, dan macro F1-score 61,44%, serta didukung oleh validasi K-Fold yang menunjukkan performa stabil. Hasil ini menegaskan bahwa model LSTM efektif digunakan untuk klasifikasi Multi-Label ujaran kebencian dengan pemilihan hyperparameter yang tepat.

ENGLISH:

Hate speech on social media is a serious issue that affects the quality and harmony of online interactions, particularly on platforms such as Twitter. This study aims to perform Multi-Label hate speech classification on Indonesian-language tweets using a Long Short-Term Memory (LSTM) model. The dataset was processed through text preprocessing stages and represented using Word2Vec based on the Skip-Gram method. Model testing was conducted through a hyperparameter tuning process involving 24 experimental scenarios that combined embedding dimensions, the number of LSTM units, batch size, and threshold values. Model performance was measured using subset accuracy, hamming loss, macro precision, macro recall, and macro F1-score. The results indicate that the threshold parameter has the most significant impact on performance balance, where higher threshold values improve precision and subset accuracy while reducing hamming loss. The best configuration was achieved in Scenario 18 (100d–64H–64B–0.3t), yielding a subset accuracy of 52.16%, a hamming loss of 17.15%, and a macro F1-score of 61.44%, supported by K-Fold validation that demonstrated stable performance. These findings confirm that the LSTM model is effective for Multi-Label hate speech classification with appropriate hyperparameter selection.

ARABIC:

يُعدّ خطاب الكراهية في وسائل التواصل الاجتماعي مشكلةً خطيرة تؤثر سلبًا على راحة المستخدمين وانسجام التفاعلات الرقمية، لا سيما على منصات مثل تويتر. يهدف هذا البحث إلى تصنيف خطاب الكراهية متعدد التسميات في التغريدات المكتوبة باللغة الإندونيسية باستخدام نموذج الذاكرة طويلة وقصيرة المدى (LSTM). تمّت معالجة البيانات من خلال مراحل المعالجة المسبقة للنص، ثم تمثيلها باستخدام نموذج Word2Vec المعتمد على طريقة Skip-Gram ، وبعد ذلك تم اختبار النموذج عبر 24 سيناريوًّا مع اختلاف أبعاد التضمين، وعدد وحدات LSTM، وحجم الدفع(Batch Size) ، وقيم العتبة (Threshold). تم تقييم أداء النموذج باستخدام مقاييس الدقة الجزئية(Subset Accuracy) ، وخسارة هامنج(Hamming Loss) ، والدقة الكلية(Macro Precision) ، والاستدعاء الكلي(Macro Recall)، ودرجة F1 الكلية (Macro F1-Score). أظهرت نتائج البحث أن قيمة العتبة لها التأثير الأكثر أهمية على توازن الأداء، حيث تؤدي القيم الأعلى إلى زيادة الدقة الجزئية والدقة الكلية، وتقليل خسارة هامنج. وقد تم الحصول على أفضل أداء في السيناريو الثامن عشر (100d–64H–64B–0.3t) مع دقة جزئية بلغت %52.16، وخسارة هامنج بنسبة %17.15، ودرجة F1 كلية بنسبة 61.44%، كما دعمت نتائج التحقق باستخدام K-Fold استقرار أداء النموذج. تؤكد هذه النتائج أن نموذج LSTM فعّال في تصنيف خطاب الكراهية متعدد التسميات عند اختيار معاملات الضبط المناسبة.

Item Type: Thesis (Undergraduate)
Supervisor: Aziz, Okta Qomaruddin and Santoso, Irwan Budi
Keywords: ujaran kebencian; multilabel classification; LSTM; Word2Vec; tweet berbahasa Indonesia; hate speech; multilabel classification; LSTM; Word2Vec; Indonesian tweets; خطاب الكراهية؛ التصنيف متعدد التسميات؛ LSTM؛ Word2Vec؛ التغريدات باللغة الإندونيسية
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing
08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Firna Firna
Date Deposited: 24 Feb 2026 13:44
Last Modified: 24 Feb 2026 13:44
URI: http://etheses.uin-malang.ac.id/id/eprint/83073

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item