Rahmadhani, Nurul Izzah (2023) Klasifikasi tanggapan masyarakat mengenai childfree menggunakan improved k-nearest neighbor: studi kasus di twitter. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
19650014.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
INDONESIA:
Kalimat perbincangan di tengah masyarakat terkadang mengandung unsur perundungan mengenai topik yang sedang dibahas. Topik perbincangan masyarakat sangat beragam, salah satunya ialah masalah gaya hidup. Ungkapan pendapat masyarakat tidak hanya sebatas pada komunikasi tatap muka, melainkan juga melibatkan ekspresi online, khususnya di platform media sosial Twitter. Penelitian ini bertujuan untuk mengklasifikasikan tanggapan masyarakat di Twitter terhadap topik childfree dengan menerapkan metode Improved K-Nearest Neighbor (iKNN). Metode tersebut menggunakan pembobotan kata dengan TF-IDF dan perhitungan jarak menggunakan Cosine Similarity. Penelitian dilakukan menggunakan bahasa pemrograman Python di Google Colab. Penelitian ini mengukur kinerja sistem menggunakan metrik accuracy, precision, dan recall. Pada uji coba ke-1 menggunakan data latih sebesar 90% dan data uji 10% menghasilkan nilai accuracy 42.6%, precision 47%, dan recall 70%. Uji coba ke-2 menggunakan data latih sebesar 80% dan data uji 20% menghasilkan nilai accuracy 51%, precision 52.5%, dan recall 83%. Uji coba ke-3 menggunakan data latih sebesar 70% dan data uji 30% menghasilkan nilai accuracy 56.6%, precision 56.7%, dan recall 78%. Uji coba ke-4 menggunakan data latih sebesar 60% dan data uji 40% menghasilkan nilai accuracy 52.5%, precision 53.7%, dan recall 77%. Hasil evaluasi menunjukkan bahwa sistem lebih cenderung mendeteksi secara benar pada teks positif yang ditandai nilai recall lebih tinggi.
ENGLISH:
Discussions within society sometimes contain elements of bullying related to the discussed topics. Public discourse covers a wide range of topics, one of which is lifestyle issues. The expression of public opinion goes beyond face-to-face communication but also involves online expressions, especially on the Twitter social media platform. This research aims to classify public responses on Twitter regarding the childfree topic using the Improved K-Nearest Neighbor (iKNN) method. The method employs word weighting with TF-IDF and distance calculation using Cosine Similarity. This study was conducted using the Python programming language on Google Colab. This research measures system performance using accuracy, precision and recall metrics. In the 1st trial using 90% training data and 10% test data resulting in accuracy values of 42.6%, precision 47%, and recall 70%. The second test used 80% training data and 20% test data resulting in an accuracy value of 51%, precision 52.5% and recall 83%. The 3rd trial used 70% training data and 30% test data resulting in accuracy values of 56.6%, precision 56.7%, and recall 78%. The 4th trial used 60% training data and 40% test data resulting in accuracy values of 52.5%, precision 53.7%, and recall 77%. The evaluation results show that the system is more likely to correctly detect positive text that is characterized by a higher recall value.
ARABIC:
تحتوي النقاشات داخل المجتمع أحيانًا على عناصر التنمر حول المواضيع المطروحة. تغطي الحوارات العامة مجموعة واسعة من المواضيع، واحدة منها هي قضايا أسلوب الحياة. التعبير عن رأي الجمهور يتعدى التواصل وجهًا لوجه بل يشمل أيضًا التعبير عبر الإنترنت، خاصة على منصة وسائل التواصل الاجتماعي تويتر. تهدف هذه الدراسة إلى تصنيف استجابات الجمهور على تويتر بشأن موضوع "Childfree" باستخدام طريقة . Improved K-Nearest Neighbor (iKNN) تعتمد الطريقة على وزن الكلمات بواسطة TF-IDF وحساب المسافة باستخدام . Cosine Similarityتم إجراء هذه الدراسة باستخدام لغة البرمجة بايثون في.Google Colab يقيس هذا البحث أداء النظام باستخدام مقاييس الدقة والإحكام والاستدعاء. في التجربة الأولى، تم استخدام 90% من بيانات التدريب و10% من بيانات الاختبار مما أدى إلى قيم دقة تبلغ 42.6%، ودقة 47%، واستدعاء 70%. استخدم الاختبار الثاني 80% من بيانات التدريب و20% من بيانات الاختبار مما أدى إلى دقة تبلغ 51% ودقة 52.5% واسترجاع 83%. استخدمت التجربة الثالثة 70% من بيانات التدريب و30% من بيانات الاختبار مما أدى إلى قيم دقة 56.6%، ودقة 56.7%، واستدعاء 78%. استخدمت التجربة الرابعة 60% من بيانات التدريب و40% من بيانات الاختبار مما أدى إلى قيم دقة 52.5%، ودقة 53.7%، واستدعاء 77%. أظهرت نتائج التقييم أن النظام من المرجح أن يكتشف بشكل صحيح النص الإيجابي الذي يتميز بقيمة استدعاء أعلى.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Faisal, Muhammad and Abidin, Zainal |
Keywords: | Childfree; Cosine Similarity; Google Colab; iKNN; Python; TF-IDF |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Nurul Izzah Rahmadhani |
Date Deposited: | 05 Feb 2024 13:19 |
Last Modified: | 05 Feb 2024 13:19 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/59612 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |