Anshori, Mohamad Alif Irfan (2020) Perbandingan Metode Naïve Bayes dengan K-Nearest Neighbor (KNN) untuk Klasifikasi Kategori Abstrak Skripsi. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (fulltext)
16650029.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
INDONESIA:
Klasifikasi merupakan salah satu substansi Data Mining yang sering digunakan untuk mengelompokkan data berdasarkan kategori atau variabel tertentu. Diantara metode klasifikasi yang sering digunakan untuk mengklasifikasikan data berupa dokumen adalah Naïve Bayes dan K-Nearest Neighbor (KNN). Penelitian ini membahas secara rinci perbandingan kedua metode tersebut dengan mengukur akurasi dan lama waktu proses dengan 4 skenario uji coba. Dari hasil penelitian, Naïve Bayes mengungguli KNN dengan rata-rata hasil akurasi Naïve Bayes sebesar 76.81% dan KNN bernilai K 3, 6, 9 berturut-turut sebesar 72,47%, 71,12%, 71,56%. Namun jika hanya mengambil akurasi tertinggi, KNN unggul dengan perbandingan Naïve Bayes sebesar 72.22% dengan KNN sebesar 77.78%. Dengan catatan, selisih masih bisa bertambah berbanding lurus dengan jumlah perbendaharaan dokumen latih. Rata-rata waktu proses yang dibutuhkan Naïve Bayes sebanyak 0.31 detik berbanding KNN sebanyak 1.09 detik.
ENGLISH:
Classification is one of the substance of Data Mining which is often used to group data based on certain categories or variables. Among the classification methods that are often used to classify data in the form of documents are Naïve Bayes and K-Nearest Neighbor (KNN). This study discusses in detail the comparison of the two methods by measuring the accuracy and length of processing time with 4 trial scenarios. From the results of the study, Naïve Bayes outperformed KNN with an average accuracy of 76.81% Naïve Bayes and KNN K 3, 6, 9 respectively 72.47%, 71.12%, 71.56%. But if it only takes the highest accuracy, KNN is superior with the Naïve Bayes ratio of 72.22% with KNN of 77.78%. With notes, the difference can still increase directly proportional to the amount of treasury training documents. The average processing time required by Naïve Bayes is 0.31 seconds compared to KNN as much as 1.09 seconds.
ARABIC:
التصنيف هو أحد عناصر استخراج البيانات الذي يُستخدم غالبًا لتجميع البيانات بناءً على فئات أو متغيرات معينة. بين طرق التصنيف التي غالبًا تُستخدمه لتصنيف البيانات في شكل مستندات هي Naïve Bayes و K-Nearest Neighbor (KNN). يناقش هذا البحث بالتفصيل مقارنة الطريقتين عن طريق قياس دقة وطول مدة المعالجة مع ٤ سيناريوهات تجريبية. من نتائج البحث، تفوقت Naïve Bayes على KNN بمتوسط دقة ٧٦.٨١٪ Naïve Bayes و KNN ٣،٦،٩K على التوالي ٧٢.٤٧٪ ، ٧١.١٢٪ ، ٧١.٥٦٪. ولكن إذا كانت فقط تأخذ أعلى دقة، فإن KNN تتفوق مع نسبة Naïve Bayes ٧٢.٢٢٪ مع KNN بنسبة ٧٧.٧٨٪. مع الملاحظة، لا يزال الفرق يمكن أن يتناسب طرديا مع كمية وثائق التدريب على الخزانة. معدل وقت المعالجة الذي تتطلبه Naïve Bayes هو ٠.٣١ ثانية مقارنة بـ KNN بقدر ١.٠٩ ثانية.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Crysdian, Cahyo and Mardhiyah, Ainatul | |||||||||
Contributors: |
|
|||||||||
Keywords: | klasifikasi dokumen; perbandingan metode; naive bayes; k-nearest-neighbor; document classification; comparison of methods; الوثيقة تصنف ;مقارنة الطرق | |||||||||
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining 08 INFORMATION AND COMPUTING SCIENCES > 0806 Information Systems > 080605 Decision Support and Group Support Systems |
|||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Mohamad Alif Irfan Anshori | |||||||||
Date Deposited: | 10 Jul 2020 10:45 | |||||||||
Last Modified: | 10 Jul 2020 10:45 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/18148 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |