Hidayah, Ika Arofatul (2024) Perbandingan Algoritma Naive Bayes dengan Support Vector Machine dalam Klasifikasi Analisis Sentimen pada Aplikasi Tiktok. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
200605210025.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) |
Abstract
ABSTRAK
Di era digital saat ini, aplikasi media sosial seperti TikTok telah menjadi aspek penting dalam kehidupan masyarakat. TikTok memungkinkan pengguna untuk membuat dan berbagi video pendek, sehingga menjadi fenomena global dengan jutaan pengguna aktif. Namun, aplikasi ini juga telah menjadi subjek dari berbagai tanggapan dan opini dari masyarakat. Penelitian ini bertujuan untuk mengklasifikasikan sentimen masyarakat terhadap aplikasi TikTok berdasarkan komentar di Playstore dengan menggunakan algoritma Naïve Bayes dan Support Vector Machine (SVM). Metode penelitian ini dilakukan dengan mengumpulkan data komentar dari Playstore dengan menggunakan teknik scraping, sehingga menghasilkan 5.000 data ulasan. Tahapan pra-pemrosesan data meliputi case folding, tokenisasi, normalisasi, penghilangan stopword, stemming, dan pelabelan data menggunakan leksikon. Data yang telah diolah kemudian dibobot menggunakan Term Frequency - Inverse Document Frequency (TF-IDF) sebelum diklasifikasikan menggunakan algoritma Naïve Bayes dan SVM. Evaluasi kinerja algoritma dilakukan dengan menggunakan Confusion Matrix untuk mengukur akurasi, presisi dan recall. Hasil penelitian menunjukkan bahwa algoritma SVM memiliki akurasi yang lebih tinggi (84%) dibandingkan dengan Naïve Bayes (79%). SVM juga menunjukkan nilai precision dan recall yang lebih baik dalam mengklasifikasikan sentimen positif dan negatif dari ulasan pengguna. Dari hasil pengujian yang telah dilakukan, algoritma SVM lebih efektif dibandingkan dengan Naïve Bayes dalam analisis sentimen pada aplikasi TikTok. Penelitian ini memberikan wawasan tentang bagaimana sentimen publik dapat diukur dan dianalisis, serta menggarisbawahi pentingnya memilih algoritma yang tepat untuk analisis sentimen data pada platform media sosial.
ABSTRACT
In the current digital era, social media applications such as TikTok have become an important aspect of people's lives. TikTok allows users to create and share short videos, making it a global phenomenon with millions of active users. However, this application has also been the subject of various responses and opinions from the public. This research aims to classify public sentiment towards the TikTok application based on comments on Playstore using the Naïve Bayes algorithm and Support Vector Machine (SVM). This research method involves collecting comment data from Playstore using scraping techniques, resulting in 5,000 review data. Data pre-processing stages include case folding, tokenization, normalization, stopword removal, stemming, and data labeling using a lexicon. The data that has been processed is then weighted using Term Frequency - Inverse Document Frequency (TF-IDF) before being classified using the Naïve Bayes and SVM algorithms. Algorithm performance evaluation is carried out using the Confusion Matrix to measure accuracy, precision and recall. The research results show that the SVM algorithm has higher accuracy (84%) compared to Naïve Bayes (79%). SVM also shows better precision and recall values in classifying positive and negative sentiment from user reviews. From the results of the tests that have been carried out, the SVM algorithm is more effective than Naïve Bayes in sentiment analysis of the TikTok application. This research provides insight into how public sentiment can be measured and analyzed, and underscores the importance of choosing the right algorithm for data sentiment analysis on social media platforms.
مستخلص البحث
في العصر الرقمي اليوم، أصبحت تطبيقات الوسائط الاجتماعية مثل تيك توك جانبا مهما من حياة الناس. يتيح تيك توك للمستخدمين إنشاء مقاطع فيديو قصيرة ومشاركتها، مما يجعلها ظاهرة عالمية مع ملايين المستخدمين النشطين. ومع ذلك، فقد كان هذا التطبيق أيضا موضوع ردود وآراء مختلفة من الجمهور. تهدف هذه الرسالة إلى تصنيف المشاعر العامة تجاه تطبيق تيك توك بناء على التعليقات على متجر جوجل (Google Playstore) باستخدام خوارزمية المصنف البايزي الساذج وآلة المتجه الداعم. تم تنفيذ طريقة البحث هذه من خلال جمع بيانات التعليقات من متجر جوجل باستخدام تقنية الكشط، مما أدى إلى 5000 بيانات مراجعة. تتضمن مراحل المعالجة المسبقة للبيانات طي الحالة، والترميز، والتطبيع، وإزالة الكلمات التوقفية، والوقف، ووضع العلامات على البيانات باستخدام المعاجم. ثم تم ترجيح البيانات المعالجة باستخدام معامل تردد المصطلح – معكوس تردد الوثيقة (TF-IDF) قبل تصنيفها باستخدام خوارزمية المصنف البايزي الساذج وآلة المتجه الداعم. تم إجراء تقييم أداء الخوارزمية باستخدام مصفوفة الارتباك لقياس الدقة والثبات والاستدعاء. أظهرت النتائج أن خوارزمية المصنف البايزي الساذج كانت ذات دقة أعلى (28٪) مقارنة بالمصنف البايزي الساذج (79٪). أظهرت آلة المتجه الداعم أيضا دقة أفضل وقيمة الاستدعاء في تصنيف المشاعر الإيجابية والسلبية من مراجعات المستخدمين. من نتائج الاختبارات التي تم إجراؤها، تعد خوارزمية آلة المتجه الداعم أكثر فاعلية من المصنف البايزي الساذج في تحليل المشاعر على تطبيق تيك توك. قدمت هذه الرسالة نظرة ثاقبة حول كيفية قياس المشاعر العامة وتحليلها، وتؤكد على أهمية اختيار الخوارزمية المناسبة لتحليل مشاعر البيانات على منصات التواصل الاجتماعي.
Item Type: | Thesis (Masters) |
---|---|
Supervisor: | Kusumawati, Ririen and Imamuddin, Muhammad |
Keywords: | Analisis Sentimen; Naive Bayes; Support Vector Machine; TikTok |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing |
Departement: | Fakultas Sains dan Teknologi > Jurusan Magister Tehnik Informatika |
Depositing User: | ika arofatul hidayah |
Date Deposited: | 28 Jun 2024 16:08 |
Last Modified: | 28 Jun 2024 16:08 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/65279 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |