Vanessa, Adelia Tasya (2023) Klasifikasi emosi pada cerita anak dengan pendekatan text mining menggunakan metode naïve bayes. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
200605110152.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) |
Abstract
INDONESIA:
Cerita anak digunakan untuk mengembangkan kemampuan membaca dan pemahaman bahasa. Tidak hanya itu cerita anak juga dapat memperkaya imajinasi, memperluas wawasan, dan menambah pengetahuan tentang berbagai emosi pada anak-anak melalui sebuah cerita. Penelitian tentang klasifikasi emosi pada cerita anak sedikit banyak dilakukan. Namun, ketidakseimbangan jumlah antar kelas sering terjadi masalah. Maka, penelitian ini bertujuan untuk mengetahui hasil performa dari metode Naïve Bayes dengan perbandingan algoritma antara Multinomial Naïve Bayes dan Complement Naiave Bayes untuk klasifikasi emosi pada cerita anak. Setiap cerita anak melalui preprocessing data pada penelitian ini meliputi case folding, stopword removal dan lemmatization. Untuk ekstraksi fitur dan pembobotan fitur digunakan metode TF-IDF. Pengujian data dilakukan dengan menggunakan split data 90:10, 80:20, dan 70:30. Berdasarkan hasil pengujian, dengan menggunakan algoritma Multinomial Naïve Bayes diperoleh rata-rata akurasi sebesar 0.67 atau 67% dan mengalami kesulitan dalam mengklasifikasi emosi. Sedangkan menggunakan Complement Naive Bayes diperoleh rata-rata 0.89 atau 89%. Dalam penelitian ini dapat ditunjukan hasil dengan menggunakan Complement Naive Bayes lebih baik dalam mengklasifikasi emosi. Metode Naïve Bayes dalam mengklasifikasikan emosi pada teks cerita anak dengan cukup baik. Tetapi hasil yang diperoleh masih belum cukup maksimal, masih perlu dikaji lagi untuk metode penyeimbangan data. Melalui proses preprocessing dan representasi numerik menggunakan TF-IDF, model juga mampu menghitung probalibilitas kemunculan emosi pada teks cerita anak.
ENGLISH:
Children's stories are used to develop reading skills and language comprehension. Not only that, children's stories can also enrich imagination, broaden horizons, and increase knowledge about various emotions in children through a story. More research has been conducted on the classification of emotions in children's stories. However, an imbalance in numbers between classes is often a problem. So, this research aims to determine the performance results of the Naïve Bayes method by comparing the algorithms between Multinomial Naïve Bayes and Complement Naïve Bayes for classifying emotions in children's stories. Each child's story goes through data preprocessing in this research including case folding, stopword removal, and lemmatization. For feature extraction and feature weighting, the TF-IDF method is used. Data testing was carried out using split data of 90:10, 80:20, and 70:30. Based on the test results, using the Multinomial Naïve Bayes algorithm obtained an average accuracy of 0.67 or 67% and experienced difficulty in classifying emotions. Meanwhile, using Complement Naïve Bayes obtained an average of 0.89 or 89%. In this research, it can be shown that the results using Complement Naïve Bayes are better at classifying emotions. The Naïve Bayes method in classifying emotions in children's story texts is quite good. However, the results are still not optimal, and the data balancing method must be studied further. Through preprocessing and numerical representation using TF-IDF, the model can also calculate the probability of the appearance of emotions in children's story texts.
ARABIC:
تستخدم قصص الأطفال لتنمية مهارات القراءة واستيعاب اللغة. وليس هذا فحسب، فقصص الأطفال يمكنها أيضًا إثراء الخيال وتوسيع الآفاق وزيادة المعرفة بالمشاعر المختلفة لدى الأطفال من خلال القصة. تم إجراء المزيد من الأبحاث حول تصنيف العواطف في قصص الأطفال. ومع ذلك، غالبًا ما يمثل عدم التوازن في الأعداد بين الفئات مشكلة. لذا، يهدف هذا البحث إلى تحديد
Complement و Multinomial Naïve Bayes بين الخوارزميات مقارنة خلال من Naïve Bayes طريقة أداء نتائج
Bayes Naïve لتصنيف العواطف في قصص الأطفال. تمر قصة كل طفل بالمعالجة المسبقة للبيانات في هذا البحث بما في ذلك طي الحالة وإزالة كلمة التوقف والإضفاء الطابع الشخصي. لاستخراج الميزة ووزن الميزة، يتم استخدام طريقة .TF-IDF تم إجراء اختبار البيانات باستخدام بيانات مقسمة 90:10، 80:20، و.70:30 بناءً على نتائج الاختبار، باستخدام خوارزمية Bayes Naïve المتعددة الحدود، تم الحصول على دقة متوسطة تبلغ 0.67 أو %67 وواجهت صعوبة في تصنيف المشاعر. وفي الوقت نفسه، باستخدام Bayes Naïve Complement حصل على متوسط 0.89 أو .%89 في هذا البحث، يمكن إثبات أن النتائج باستخدام Bayes Naïve Complement هي الأفضل في تصنيف العواطف. إن طريقة Bayes Naïve في تصنيف العواطف في نصوص قصص الأطفال جيدة جدًا. ومع ذلك، فإن النتائج لا تزال غير مثالية، ويجب دراسة طريقة موازنة البيانات بشكل أكبر. ومن خلال المعالجة المسبقة والتمثيل العددي باستخدام TF-IDF يمكن للنموذج أيضًا حساب احتمالية ظهور العواطف في نصوص قصص الأطفال.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Yaqin, M. Ainul and Abidin, Zainal |
Keywords: | Klasifikasi; Emosi; Cerita Anak; Naïve Bayes Classification; Emotion; Children’s Story; Naïve Bayes حيةالتصنيف،العاطفة،قصةاألطفال،ساذجباي |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0806 Information Systems > 080699 Information Systems not elsewhere classified 08 INFORMATION AND COMPUTING SCIENCES > 0899 Other Information and Computing Sciences > 089999 Information and Computing Sciences not elsewhere classified |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Adelia Tasya Vanessa |
Date Deposited: | 20 Dec 2024 08:37 |
Last Modified: | 20 Dec 2024 08:37 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/70664 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |