Wardani, Intan Pramuda (2025) Analisis sentimen pengguna X terhadap aplikasi Wattpad menggunakan metode Naïve Bayes. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
19680055.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (5MB) |
Abstract
INDONESIA
Aplikasi wattpad merupakan aplikasi yang populer dalam Google Play Store karena sudah ada sejak tahun 2006, akan tetapi masih terdapat beberapa permasalahan seperti sering error dan terlalu banyak iklan. Oleh karena itu perlu dilakukan penelitian lebih lanjut tentang analisis sentimen pengguna terhadap aplikasi Wattpad pada media sosial X. Penelitian ini bertujuan untuk mengetahui seberapa baik algoritma Naïve Bayes Classifier dalam pengklasifikasian opini menjadi sentimen positif dan negatif. Data yang digunakan berasal dari media sosial X melalui proses crawling menggunakan Tweet Harvest dengan kata kunci “Wattpad” pada tweet berbahasa Indonesia. Selanjutnya, dilakukan tahap pra-pemrosesan seperti cleansing, case folding, tokenizing, stopword removal, dan stemming menggunakan library Sastrawi. Pembobotan kata dilakukan menggunakan metode TF-IDF, selanjutnya dilakukan tahap klasifikasi menggunakan algoritma Naïve Bayes. Evaluasi dilakukan dengan menggunakan metrik akurasi, presisi, recall, dan F1-Score. Skenario penelitian dilakukan dengan rasio data latih dan data uji 70:30, 80:20 dan 90:10. Dari perbandingan ketiga rasio tersebut diperoleh bahwa model 90:10 menghasilkan akurasi, presisi, recall dan f-1 score yang tinggi dibandingkan yang lain. Penelitian ini menunjukkan bahwa model yang dihasilkan algoritma Naïve Bayes dengan rasio 90:10 efektif dalam mengklasifikasikan sentimen pengguna terhadap evaluasi aplikasi Wattpad.
ENGLISH
The Wattpad application is a popular application in the Google Play Store because it has been around since 2006, but there are still some problems such as frequent errors and too many advertisements. Therefore, further research is needed on user sentiment analysis of the Wattpad application on social media X. This study aims to determine how well the Naïve Bayes Classifier algorithm classifies opinions into positive and negative sentiments. The data used comes from social media X through a crawling process using Tweet Harvest with the keyword "Wattpad" in Indonesian tweets. Next, pre-processing stages are carried out such as cleansing, case folding, tokenizing, stopword removal, and stemming using the Sastrawi library. Word weighting is carried out using the TF-IDF method, then the classification stage is carried out using the Naïve Bayes algorithm. Evaluation is carried out using accuracy, precision, recall, and F1-Score metrics. The research scenario is carried out with a ratio of training data and test data of 70:30, 80:20 and 90:10. A comparison of the three ratios revealed that the 90:10 model produced higher accuracy, precision, recall, and F-1 score than the others. This study demonstrates that the model generated by the Naïve Bayes algorithm with a 90:10 ratio is effective in classifying user sentiment regarding Wattpad app evaluations.
ARABIC
يُعد تطبيق Wattpad تطبيقًا شائعًا على متجر Google Play نظرًا لوجوده منذ عام 2006، إلا أنه لا يزال يعاني من بعض المشاكل، مثل الأخطاء المتكررة والإعلانات الكثيرة. لذلك، هناك حاجة إلى مزيد من البحث حول تحليل مشاعر مستخدمي تطبيق Wattpad على منصات التواصل الاجتماعي X. تهدف هذه الدراسة إلى تحديد مدى كفاءة خوارزمية تصنيف بايز الساذج في تصنيف الآراء إلى إيجابية وسلبية. تم الحصول على البيانات المستخدمة من منصة التواصل الاجتماعي X من خلال عملية زحف باستخدام Tweet Harvest مع الكلمة المفتاحية "Wattpad" في التغريدات الإندونيسية. بعد ذلك، تُجرى مراحل المعالجة المسبقة، مثل التنظيف، وطي الأحرف، والترميز، وإزالة الكلمات غير المرغوب فيها، والتجذير باستخدام مكتبة Sastrawi. يُجرى ترجيح الكلمات باستخدام طريقة TF-IDF، ثم تُجرى مرحلة التصنيف باستخدام خوارزمية بايز الساذج. يُجرى التقييم باستخدام مقاييس الدقة، والدقة، والتذكر، ودرجة F1. نُفِّذ سيناريو البحث باستخدام نسب بيانات التدريب وبيانات الاختبار 70:30، 80:20، و90:10. أظهرت مقارنة النسب الثلاث أن نموذج 90:10 حقق دقةً ودقةً واستدعاءً ودرجة F-1 أعلى من غيره. تُظهر هذه الدراسة أن النموذج المُولَّد بواسطة خوارزمية بايز الساذجة بنسبة 90:10 فعال في تصنيف آراء المستخدمين حول تقييمات تطبيق واتباد.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Mahfud, Fakhris Khusnu Reza and Yulianto, Yulianto |
Keywords: | Analisis Sentimen; Naïve Bayes; Wattpad; TF-IDF; Media Sosial X; Text Mining; Sentiment Analysis; Naïve Bayes; Wattpad; TF-IDF; Social Media X; Text Mining; تحليل المشاعر؛ بايز الساذج؛ واتباد؛ TF-IDF؛ وسائل التواصل الاجتماعي X؛ استخراج النصوص؛ |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0806 Information Systems > 080612 Interorganisational Information Systems and Web Services |
Departement: | Fakultas Sains dan Teknologi > Jurusan Perpustakaan dan Sains Informasi |
Depositing User: | intan pramuda wardani |
Date Deposited: | 15 Aug 2025 10:30 |
Last Modified: | 15 Aug 2025 10:30 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/80244 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |