Munir, Nur Azizah (2024) Klasifikasi cyberbullying menggunakan metode learning vector quantization (LVQ) dengan ekstraksi fitur term frequency-inverse document frequency (TF-IDF). Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text
19650051.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (3MB) |
Abstract
INDONESIA:
Seiring meningkatnya penggunaan media sosial, cyberbullying telah mencapaititik puncaknya. Anonimitas di internet membuat cyberbullying sangat merusak,menyebabkan korban merasa tidak ada jalan keluar dari pelecehan tersebut. Setiap individuharus selalu waspada terhadap cyberbullying dan dihimbau untuk melindungi diri sendiriserta orang lain dari hal ini. Penulis membuat model yang secara otomatis menandai tweetyang berpotensi membahayakan dan memecah pola pesan kebencian. Penelitian inimembahas klasifikasi cyberbullying menggunakan metode Learning Vector Quantization(LVQ) dengan ekstraksi fitur Term Frequency-Inverse Document Frequency (TF-IDF).Dataset yang digunakan berisi sekitar 1000 tweet yang telah dilabeli menjadi 5 jenis yaitureligion, gender, age, ethnicity dan not cyberbullying. Data yang telah terlabeli akandilakukan proses pre-processing dengan melalui empat tahapan yaitu normalization,tokenizing, stemming, dan stopword removal. Kemudian data tersebut akan dilakukanpembobotan kata menggunakan TF-IDF. Skenario pengujian dilakukan denganmenggunakan beberapa model pembagian data dan variasi parameter learning rate. Datatraining akan dilakukan pemodelan menggunakan metode Learning Vector Quantization.Sehingga dari hasil pemodelan tersebut sistem dapat melakukan klasifikasi. Berdasarkanhasil uji coba yang dilakukan terhadap klasifikasi cyberbullying menggunakan total 12skenario pengujian mampu menghasilkan hasil akurasi paling optimal sebesar 86.5%.Dengan demikian, hasil penelitian ini menunjukkan bahwa penggunaan metode LearningVector Quantization dengan ekstraksi fitur TF-IDF serta pemilihan learning rate yang tepatdan pembagian data yang optimal dapat secara efektif mengklasifikasikan cyberbullyingpada media sosial twitter.
ENGLISH:
The increase in social media use has led cyberbullying to achieve its peak point.Anonymity on the internet makes cyberbullying destructive. It causes the victims to feelthat they have no way out. Each individual must be wary of cyberbullying and she/he mustprotect him/herself and other people from this. The researcher has made a model thatautomatically marks potentially dangerous tweets and breaks hatred message patterns. Theresearch discusses cyberbullying classification using the Learning Vector Quantization(LVQ) method and Term Frequency-Inverse Document Frequency (TF-IDF) featureextraction. The used dataset consists of 1,000 tweets labeled into five types: religion,gender, age, ethnicity, and not cyberbullying. The labeled data will be pre-processedthrough four steps: normalization, tokenizing, stemming, and stop word removal. Then, theresearcher conducted word weighing with the data using TF-IDF. A testing scenarioinvolved some data distribution models and several learning rate parameters. The datatraining would be modeled using the Learning Vector Quantization method, by which thesystem could generate classification. Based on the try-out result on cyberbullyingclassification using 12 testing scenarios, the most optimal accuracy was 86,5%. Therefore,the research result shows that using the Learning Vector Quantization method with TF-IDFfeature extraction, adding the correct learning rate, and an optimal data distribution caneffectively classify cyberbullying on social media Twitter.
ARABIC:
مع زايدة استخدام وسائل التواصل االجتماعي، وصل التنمر اإللكرتوين إىل ذروته. إن إخفاء اهلوية على اإلنرتنت جيعل التنمر اإللكرتوينضارا للغاية، مما جيعل الضحااي يشعرون أنه ال توجد طريقة للخروج من املضايقات. جيب أن يكون كل فرد دائما على دراية ابلتنمراإللكرتوين ويتم حثه على محاية نفسه واآلخرين من ذلك. ابتكر ت الباحثة منوذجا يقوم تلقائيا ابإلبالغ عن التغريدات اليت حيتمل أنتكون ضارة ويكسر أمناط رسائل الكراهية. انقش هذا البحث تصنيف التنمر اإللكرتوين ابستخدام طريقة تعلم تكميم املتجهات)LVQ )من خالل استخراج ميزة يت اف-اي دي دف )IDF-TF). حتتوي جممو عة البياانت املستخدمة على حوايل 1000تغريدة مت تصنيفها إىل 5 أنواع، وهي الدين واجلنس والعمر والعرق و عدم التنمر اإللكرتوين. ستتم معاجلة البياانت املصنفة مسبقا منخالل أربع مراحل، وهي التطبيع، والرتميز، والتوقيف، وإزالة الكلمة املوقفة . مث سيتم ترجيح البياانت ابستخدام يت اف-اي دي دف)IDF-TF). مت تنفيذ سيناريو االختبار ابستخدام عدة مناذج مشاركة البياانت واالختالفات يف معلمات معدل التعلم. سيتم منذجةبياانت التدريب ابستخدام طريقة تعلم تكميم امل تجهات. حبيث من نتائج النمذجة، ميكن للنظام أن يقوم ابلتصنيف. استنادا إىل نتائجاالختبارات اليت أجريت على تصنيف الت نمر اإللكرتوين ابستخدام 12 سيناريو هات االختبار، متكنت من حتقيق أفضل نتيجة دقة بنسبة.٪86.5 وابلتايل، أظهر ت نتائج هذا البحث أن استخدام طريقة تعلم تكميم املتجهات مع استخراج ميزة يت اف-اي دي دف،ابإلضافة إىل اختيار معدل التعلم الصحيح واملشاركة املثلى للبياانت ميكن أن يصنف بشكل فعال التنمر اإللكرتوين على وسائلالتواصل االجتماعي " تويرت".
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Aziz, Okta Qomaruddin and Hariyadi, Amin |
Keywords: | Klasifikasi Cyberbullying; Learning Vector Quantization; Cyberbullying; Cyberbullying Classification; The Learning Vector Quantization; Cyberbullying; تصنيف التنمر اإللكرتوين; تعلم تكميم امل تجهات; التنمر اإللكرتوين |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Nur Azizah Munir |
Date Deposited: | 22 Jul 2024 15:06 |
Last Modified: | 31 Jul 2024 14:16 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/65176 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |