Alfathir, Muhammad Dimas (2026) Analisis sentimen komentar penonton YouTube terhadap topik korupsi pada kanal edukasi Malaka Project menggunakan algoritma Random Forest. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
220607110026.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (3MB) |
Abstract
INDONESIA:
Media sosial YouTube menjadi ruang digital bagi masyarakat untuk menyampaikan opini terhadap isu publik, termasuk korupsi. Penelitian ini bertujuan menganalisis klasifikasi sentimen komentar penonton pada dua video kanal edukasi Malaka Project, yaitu “Korupsi Terstruktur dan Terjahat Pertamina” dan “Vonis Tom Lembong Adalah Masalah Publik”, serta membandingkan distribusi sentimen pada kedua video tersebut. Penelitian ini menggunakan pendekatan kuantitatif berbasis text mining dengan algoritma Random Forest. Data diperoleh melalui teknik scraping sebanyak 4.544 komentar, kemudian diberi label manual oleh tiga ahli bahasa ke dalam tiga kelas, yaitu positif, netral, dan negatif. Tahapan penelitian meliputi preprocessing text, pembobotan kata menggunakan TF-IDF, pembagian data latih dan data uji dengan rasio 80:20 dan 70:30, serta evaluasi model menggunakan confusion matrix. Hasil penelitian menunjukkan bahwa skenario rasio 70:30 menghasilkan performa terbaik dengan akurasi 76%, precision weighted average 72%, recall 76%, dan f1-score 73%. Namun, nilai macro average masih rendah, yaitu precision 54%, recall 46%, dan f1-score 48%, karena distribusi label tidak seimbang dan didominasi sentimen positif. Pada video pertama, sentimen positif mencapai 75%, sedangkan pada video kedua mencapai 78,6%. Proporsi sentimen negatif pada kasus korupsi individu hanya 3%, lebih rendah daripada korupsi sistemik sebesar 11%. Temuan ini menunjukkan bahwa penonton cenderung lebih defensif terhadap kasus korupsi individu. Penelitian ini menyarankan penggunaan teknik penanganan data tidak seimbang, perluasan sumber data, serta perbandingan algoritma lain agar deteksi sentimen minoritas lebih akurat dengan tetap memperhatikan konteks bahasa Indonesia dan dinamika percakapan digital.
ENGLISH:
YouTube social media has become a digital space to express opinions on public issues, including corruption. The research aims to analyze the sentiment classification of viewer comments on two educational videos published by the Malaka Project channel, namely “Korupsi Terstruktur dan Terjahat Pertamina” and “Vonis Tom Lembong Adalah Masalah Publik”. It also compares the sentiment distribution across the two videos. It employed a quantitative approach based on text mining using the Random Forest algorithm. The researcher collected 4,544 comments through scraping techniques and involved three language experts to manually label the comments into three categories—positive, neutral, and negative. The research procedures consisted of text preprocessing, term weighting using TF-IDF, splitting the dataset into training and testing sets with ratios of 80:20 and 70:30, and evaluating the model using a confusion matrix. The research results indicate that the 70:30 ratio scenario generated the best performance, achieving 76% accuracy, 72% weighted average precision, 76% recall, and a 73% f1-score. However, the macro average values remained low, with 54% precision, 46% recall, and a 48% f1-score, due to the imbalanced label distribution dominated by positive sentiment. In the first video, positive sentiment reached 75% of the comments, while in the second video it reached 78.6%. The proportion of negative sentiment in the case of individual corruption was only 3%, lower than the 11% observed in systemic corruption cases. These findings suggest that viewers tend to show more defensive attitude toward cases of individual corruption. Therefore, the research recommends the application of imbalance-handling techniques, the expansion of data sources, and comparisons with other algorithms to improve the accuracy of minority sentiment detection while still considering the Indonesian language context and the digital conversation dynamics.
ARABIC:
أصبح وسائل التواصل الاجتماعي يوتيوب مساحة رقمية للمجتمع للتعبير عن آرائهم بشأن القضايا العامة، بما في ذلك الفساد. يهدف هذا البحث إلى تحليل تصنيف المشاعر لتعليقات المشاهدين على مقطعين فيديو لقناة مشروع مالاكا التعليمي، وهما "الفساد المنظم والأجرم لشركة فرتامينا" و"حكم توم لمبونج هو قضية عامة"، وكذلك مقارنة توزيع المشاعر بين هذين المقطعين. استخدم هذا البحث منهجا كميا مبنيا على استخراج النصوص باستخدام خوارزمية الغابة العشوائية. تم الحصول على البيانات من خلال تقنية الاستخراج وعددها 4544 تعليقًا، ثم تم وضع العلامات يدويًا من قبل ثلاثة خبراء لغويين إلى ثلاث فئات، وهي الإيجابية، والمحايدة، والسلبية. تشمل مراحل الدراسة معالجة النصوص المسبقة، وتوزين الكلمات باستخدام تي اف-اي دي دف (TF-IDF)، وتقسيم البيانات إلى بيانات تدريبية وبيانات اختبار بنسبة 80:20 و70:30، وكذلك تقييم النموذج باستخدام مصفوفة الارتباك. أظهرت نتائج البحث أن سيناريو النسبة 70:30 يعطي أفضل أداء بدقة 76٪، ومتوسط الوزن للثبات 72٪، والاسترجاع 76٪، ودرجة ف1 73%. ومع ذلك، فإن قيمة المتوسط الكلي لا تزال منخفضة، حيث الثبات 54٪، والاسترجاع 46٪، ودرجة ف1 48%، بسبب عدم توازن توزيع التصنيفات وسيطرة المشاعر الإيجابية. في الفيديو الأول، وصلت نسبة المشاعر الإيجابية إلى 75٪، بينما في الفيديو الثاني بلغت 78.6٪. ونسبة المشاعر السلبية في حالات الفساد الفردي هي فقط 3٪، وهي أقل من الفساد النظامي الذي يبلغ 11٪. تشير هذه النتائج إلى أن المشاهدين يميلون إلى اتخاذ موقف أكثر دفاعية في مواجهة حالات الفساد الفردية. يوصي هذا البحث باستخدام تقنيات معالجة البيانات غير المتوازنة، وتوسيع مصادر البيانات، وكذلك مقارنة الخوارزميات الأخرى من أجل جعل اكتشاف مشاعر الأقلية أكثر دقة مع مراعاة سياق اللغة الإندونيسية وديناميكيات المحادثات الرقمية.
| Item Type: | Thesis (Undergraduate) |
|---|---|
| Supervisor: | Mahfud, Fakhris Khusnu Reza and Yulianto, Yulianto |
| Keywords: | analisis sentimen; random forest; tf-idf; korupsi; malaka project; sentiment analysis; random forest; tf-idf; corruption; malaka project; ; TF-IDF; تحليل مشاعر; غابة عشوائية; فساد; مشروع مالاكا |
| Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining |
| Departement: | Fakultas Sains dan Teknologi > Jurusan Perpustakaan dan Sains Informasi |
| Depositing User: | Dimas Alfathir |
| Date Deposited: | 25 May 2026 08:29 |
| Last Modified: | 25 May 2026 08:29 |
| URI: | http://etheses.uin-malang.ac.id/id/eprint/84705 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |
