Oktavia, Kiki (2023) Pendekatan multinomial Naive Bayes untuk klasifikasi jenis-jenis cyber harassment di media sosial Twitter. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
19610079.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) |
Abstract
INDONESIA:
Multinomial Naïve Bayes merupakan metode klasifikasi dari Naïve Bayes Classifier yang berlandaskan pada Teorema Bayes dan distribusi multinomial yang bekerja dengan optimal pada kasus klasifikasi multiclass data teks. Multinomial Naïve Bayes menghitung peluang kemunculan setiap kata dengan mengalikan nilai probabilitas prior kelas dengan nilai likelihood kemunculan setiap kata pada setiap kelas. Fenomena Cyber Harassment didefinisikan sebagai perilaku memanfaatkan teknologi dengan tujuan untuk merugikan atau mempermalukan seseorang. Twitter merupakan salah satu media sosial dengan kasus Cyber Harassment tertinggi. Data yang digunakan dalam penelitian ini adalah 2.000 tweet berbahasa Indonesia yang dikumpulkan menggunakan Application Programming Interface yang disediakan oleh Twitter pada bulan Januari hingga Juni 2023. Jenis-jenis Cyber Harassment yang terdiri dari Physical Threats, Purposeful Embarrassment, Racist, dan Sexual Harassment merupakan variabel dependen, sedangkan kata-kata yang terkumpul pada tweet adalah variabel dependen. Penelitian ini menggunakan 95% data training dan 5% data testing. Penelitian ini bertujuan untuk mendapatkan hasil klasifikasi dengan akurasi yang baik mengenai jenis-jenis Cyber Harassment di media sosial Twitter menggunakan metode Multinomial Naïve Bayes. Hasil klasifikasi yang diperoleh yaitu 20 dokumen terklasifikasi sebagai Physical Threats, 10 dokumen terklasifikasi sebagai Purposeful Embarrassment, 25 dokumen terklasifikasi sebagai Racist, dan 22 dokumen terklasifikasi sebagai Sexual Harassment. Tingkat akurasi klasifikasi jenis-jenis Cyber Harassment di media sosial Twitter menggunakan Multinomial Naïve Bayes sebesar 77% dan hasil uji performa model dengan K-fold Cross Validation sebesar 76,21% menunjukkan bahwa metode Multinomial Naïve Bayes dapat mengklasifikasi jenis-jenis Cyber Harassment di media sosial Twitter dengan baik.
ENGLISH:
Multinomial Naïve Bayes is a classification method in Naïve Bayes Classifier based on Bayes Theorem and multinomial distribution that works optimally in the multiclass classification of text data. Furthermore, it calculates the probability of occurrence of each word by multiplying the class prior probability by the likelihood value of the occurrence of each word in each class. The phenomenon of Cyber Harassment is defined as the behavior of utilizing technology to harm or humiliate people. Twitter is one of the social media with the highest Cyber Harassment cases. The data used in this study is collected 2,000 Indonesian tweets using Application Programming Interface provided by Twitter from January to June 2023. The types of Cyber Harassment, which consist of Physical Threats, Purposeful Embarrassment, Racist, and Sexual Harassment, are the dependent variables, and the words collected are the independent variables. Then, it used 95% training data and 5% testing data. This study aims to classify results accurately regarding the types of Cyber Harassment on Twitter using the Multinomial Naïve Bayes method. The classification results obtained are 20 documents classified as Physical Threats, 10 documents classified as Purposeful Embarrassment, 25 documents classified as Racist, and 22 documents classified as Sexual Harassment. The accuracy of classification of types of Cyber Harassment on Twitter using Multinomial Naïve Bayes is 77% and the results of the model performance test with K-fold Cross Validation is 76.21%, showing that the Multinomial Naïve Bayes method can classify the types of Cyber Harassment on Twitter effectively.
ARABIC:
Naïve Bayes متعدد الحدود (MNB) هي طريقة تصنيف في Naïve Bayes Classifier تعتمد على نظرية بايز والتوزيع متعدد الحدود الذي يعمل على النحو الأمثل في التصنيف متعدد الفئات للبيانات النصية. علاوة على ذلك ، فإنه يحسب احتمال حدوث كل كلمة بضرب الاحتمال السابق للفئة في قيمة احتمال حدوث كل كلمة في كل فئة. تعرف ظاهرة التحرش السيبراني بأنها سلوك استخدام التكنولوجيا لإيذاء الناس أو إذلالهم. تويتر هو واحد من وسائل التواصل الاجتماعي مع أعلى حالات التحرش السيبراني. تم جمع البيانات المستخدمة في هذه الدراسة 2000 تغريدة إندونيسية باستخدام واجهة برمجة التطبيقات التي يوفرها Twitter من يناير إلى يونيو 2023. أنواع التحرش السيبراني ، والتي تتكون من التهديدات الجسدية ، والإحراج المتعمد ، والعنصرية ، والتحرش الجنسي ، هي المتغيرات التابعة ، والكلمات التي تم جمعها هي المتغيرات المستقلة. بعد ذلك ، استخدمت 95٪ من بيانات التدريب و 5٪ من بيانات الاختبار. تهدف هذه الدراسة إلى تصنيف النتائج بدقة فيما يتعلق بأنواع التحرش الإلكتروني على تويتر باستخدام طريقة MNB. نتائج التصنيف التي تم الحصول عليها هي 20 وثيقة مصنفة على أنها تهديدات جسدية ، و 10 وثائق مصنفة على أنها إحراج متعمد ، و 25 وثيقة مصنفة على أنها عنصرية ، و 22 وثيقة مصنفة على أنها تحرش جنسي. تبلغ دقة تصنيف أنواع التحرش الإلكتروني على تويتر باستخدام ساذج بايز متعدد الحدود 77٪ ونتائج اختبار أداء النموذج باستخدام التحقق من صحة K-fold Cross هي 76.21٪ ، مما يدل على أن طريقة MNB يمكنها تصنيف أنواع التحرش الإلكتروني على تويتر بشكل فعال.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Karisma, Ria Dhea Layla Nur and Kusumastuti, Ari |
Keywords: | Multinomial Naïve Bayes; Teorema Bayes; Cyber Harassment; Twitter; Bayes Theorem; Types of Cyber Harassment; ساذجة بايز متعددة الجنسيات; نظرية بايز; التحرش الإلكتروني; تويتر |
Departement: | Fakultas Sains dan Teknologi > Jurusan Matematika |
Depositing User: | Kiki Oktavia |
Date Deposited: | 10 Oct 2023 10:42 |
Last Modified: | 10 Oct 2023 10:42 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/40836 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |