Responsive Banner

Sistem klasifikasi berita kriminal menggunakan metode naive bayes classifier

Assagaf, Sayyid Muhammad Uwais Fathonah (2023) Sistem klasifikasi berita kriminal menggunakan metode naive bayes classifier. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
19650052.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB)

Abstract

INDONESIA:

Berita yang tersedia di media online lebih diminati oleh masyarakat karena lebih efisien dibandingkan dengan media cetak. Situs portal berita menjadi sumber informasi berita yang dapat menyajikan dan juga mengumpulkan berita-berita dari berbagai sumber untuk jadi landasan informasi kepada pembaca. Berita diunggah pada portal berita umumnya dikelompokkan dalam beberapa kategori, seperti berita politik, berita kriminal, atau berita lainnya. Namun, berita tersebut tidak ditempatkan di bawah sub kategori. Penelitian ini menggunakan salah satu metode klasifikasi teks yaitu metode Naïve Bayes Classifier. Tujuan dari penelitian ini untuk dapat mengukur seberapa akurat dalam mengklasifikasikan Berita kriminal, menggunakan metode ini dipilih untuk klasifikasi teks karena kemudahan implementasinya dan efisiensi komputasional yang dimilikinya. Data yang digunakan dalam metode Naïve Bayes merupakan data yang sudah melewati tahap preprocessing. Ada beberapa tahapan dalam preprocessing yakni clean text atau case folding, tokenization, filtering (stopword removal), dan Stemming. Selanjutnya datayang telah melewati tahapan preprocessing akan dihitung tiap kemunculan kata pada tiap artikel berita menggunakan Term-Frequency (TF) dan nilai frekuensi inilah yang akan menjadi input pada metode Naïve Bayes. Pada pengujian pertama dengan rasio perbandingan 70:30 dengan akurasi 92,44%, presisi 81,11%, recall 81,11%, dan f-measure 81,11%. Hasil pengujian kedua dengan rasio perbandingan 80:20, dengan akurasi 91,33%, presisi 78,33%, recall 78,33%, dan f-measure 78,33%. dan hasil pengujian ketiga dengan rasio 90:10 menghasilkan akurasi 92%, presisi 80%, recall 80%, dan f-measure 80%. Hasil pengujian mengungkapkan bahwa kualitas data pelatihan memiliki dampak besar pada hasil akhir. Semakin besar jumlah data pelatihan yang digunakan, semakin baik hasilnya.

ENGLISH:

News available in online media is more desirable to the public because it is more efficient than print media. News portal sites are a source of news information that can present and also collect news from various sources to become the basis of information to readers. News uploaded on news portals are generally grouped into several categories, such as political news, crime news, or other news. However, the news is not placed under sub-categories. This research uses one of the text classification methods, namely the Naïve Bayes Classifier method. The purpose of this research is to be able to measure how accurate it is in classifying criminal news, using this method was chosen for text classification because of its ease of implementation and the computational efficiency it has. The data used in the Naïve Bayes method is data that has passed the preprocessing stage. There are several stages in preprocessing, namely clean text or case folding, tokenization, filtering (stopword removal), and Stemming. Furthermore, the data that has passed the preprocessing stage will be calculated for each word occurrence in each news article using Term-Frequency (TF) and this frequency value will be the input to the Naïve Bayes method. In the first test with a ratio of 70:30 with 92.44% accuracy, 81.11% precision, 81.11% recall, and 81.11% f-measure. The second test results with a comparison ratio of 80:20, with an accuracy of 91.33%, precision of 78.33%, recall of 78.33%, and f-measure of 78.33%. and the third test results with a ratio of 90:10 resulted in 92% accuracy, 80% precision, 80% recall, and 80% f-measure. The test results reveal that the quality of the training data has a huge impact on the final results. The larger the amount of training data used, the better the results.

ARABIC:

تعتبر الأخبار المتاحة في وسائل الإعلام عبر الإنترنت أكثر شعبية لدى الجمهور لأنها أكثر كفاءة مقارنة بالوسائط لمطبوعة. تعد مواقع بوابات الأخبار مصادر للمعلومات الإخبارية التي يمكنها تقديم الأخبار وجمعها أيضًا من مصادر مختلفة لتصبح أساسًا للمعلومات للقراء. يتم عمومًا تجميع الأخبار التي يتم تحميلها على بوابات الأخبار في عدة فئات، مثل الأخبار السياسية أو أخبار الجريمة أو الأخبار الأخرى. ومع ذلك، لا يتم وضع الأخبار تحت أي فئة فرعية. يستخدم هذا البحث إحدى طرق تصنيف النصوص وهي طريقة تصنيف Naïve Bayes. يهدف هذا البحث إلى قياس مدى دقتها في تصنيف أخبار الجرائم، وقد تم اختيار هذه الطريقة لتصنيف النصوص بسبب سهولة تنفيذها وكفاءتها الحسابية. البيانات المستخدمة في طريقة Naïve Bayes هي البيانات التي اجتازت مرحلة المعالجة المسبقة. هناك عدة مراحل في المعالجة المسبقة، وهي النص النظيف أو طي الحالة، والترميز، والتصفية (إزالة كلمة التوقف)، والاستئصال. بعد ذلك، سيتم حساب البيانات التي اجتازت مرحلة المعالجة المسبقة لكل تكرار للكلمات في كل مقالة إخبارية باستخدام تردد المدى (TF) وسيتم إدخال قيمة التردد هذه في طريقة Naïve Bayes. في الاختبار الأول، كانت النسبة 70:30 بدقة 92.44%، ودقة 81.11%، واستدعاء 81.11%، وقياس f 81.11%. وكانت نتائج الاختبار الثاني بنسبة 80:20، وبدقة 91.33%، ودقة 78.33%، واستدعاء 78.33%، وقياس f 78.33%. ونتائج الاختبار الثالث بنسبة 90:10 أنتجت دقة 92% ودقة 80% واستدعاء 80% وقياس f 80%. أظهرت نتائج الاختبار أن جودة بيانات التدريب لها تأثير كبير على النتائج النهائية. كلما زادت كمية بيانات التدريب المستخدمة، كانت النتائج أفضل

Item Type: Thesis (Undergraduate)
Supervisor: Crysdian, Cahyo and Kusumawati, Ririen
Keywords: Berita Kriminal; Klasifikasi Berita; Naïve Bayes Classifier Criminal News; News Classification; Naïve Bayes Classifier األخبار اجلنائية; تصنيف األخبار; مصنف ساذج ابيز
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing
08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080110 Simulation and Modelling
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Sayyid Muhammad Uwais Fathonah Assagaf
Date Deposited: 29 Apr 2024 10:19
Last Modified: 29 Apr 2024 10:19
URI: http://etheses.uin-malang.ac.id/id/eprint/59615

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item