Cahya, Ilman Dwi (2023) Klasifikasi abstrak artikel jurnal ilmiah menggunakan Multinomial Naive Bayes. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
16650083.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) |
Abstract
INDONESIA:
Jumlah publikasi artikel tiap tahun mengalami kenaikan. Dengan kenaikan jumlah tersebut akan menyulitkan untuk pengelola jurnal untuk melakukan klasifikasi artikel jika dilakukan secara manual. Selain itu juga membutuhkan waktu yang banyak dan bisa terjadi kesalahan dalam klasifikasi dilakukan secara manual. Maka dari itu, penelitian ini dilakukan untuk klasifikasi artikel jurnal menggunakan Multinomial Naïve Bayes. Multinomial Naive Bayes sebagai salah satu metode untuk klasifikasi dan dinilai baik dalam melakukan klasifikasi dokumen. Pada penelitian ini peneliti melakukan klasifikasi abstrak artikel jurnal ilmiah menggunakan Multinomial Naive Bayes dengan hasil klasifikasi yaitu subject artikel. Dengan menggunakan 450 abstrak artikel sebagai data training dan 50 abstrak artikel sebagai data testing. Selain itu menggunakan 5 kelas subject artikel pada penelitian ini. Sebelum dilakukan klasifikasi, dilakukan training pada data training untuk metode Multinomial Naïve Bayes. Hasil dari preprocessing menghasilkan token kata yang dapat digunakan sebagai pembobotan kata. Untuk pembobotan kata pada data training menggunakan pembobotan TF-IDF. Sebelum dokumen siap untuk dilakukan klasifikasi harus melalui tahap preprocessing. Dari hasil uji coba klasifikasi data testing yang telah dilakukan didapatkan akurasi sebesar 0,99 atau 99%, precision sebesar 0,98 atau 98%, recall sebesar 0,98 atau 98%, dan f-measure sebesar 0,98 atau 98%.
ENGLISH:
The number of article publications has increased each year. With this increase in number, it will be difficult for journal managers to classify articles if done manually. In addition, it also requires a lot of time and errors can occur in the classification done manually. Therefore, this research was conducted to classify journal articles using Multinomial Naïve Bayes. Multinomial Naive Bayes is a classification method and is considered good for classifying documents. In this study, researchers classified abstract scientific journal articles using Multinomial Naive Bayes with the result of the classification being the subject of the article. By using 450 article abstracts as training data and 50 article abstracts as testing data. In addition to using 5 class subject articles in this study. Before classification, training was carried out on the training data for the Multinomial Naïve Bayes method. The results of preprocessing produce word tokens that can be used as word weights. For weighting words on training data using TF-IDF weighting. Before the document is ready to be classified, it must go through the preprocessing stage. From the results of the testing data classification trials that have been carried out, it is obtained an accuracy of 0.99 or 99%, a precision of 0.98 or 98%, a recall of 0.98 or 98%, and an f-measure of 0.98 or 98%..
ARABIC:
زاد عدد منشورات المقالات كل عام. مع هذه الزيادة في العدد، سيكون من الصعب على مديري المجلات تصنيف المقالات إذا تم إجراؤها يدويًا. بالإضافة إلى ذلك، يتطلب الأمر أيضًا وقتًا طويلاً ويمكن أن تحدث أخطاء في التصنيف الذي يتم يدويًا. لذلك، تم إجراء هذا البحث لتصنيف المقالات الصحفية باستخدام Multinomial Naïve Bayes. تعد Multinomial Naive Bayes طريقة للتصنيف وتعتبر جيدة في تصنيف المستندات. في هذه الدراسة، صنف الباحثون مقالات المجلات العلمية المجردة باستخدام Multinomial Naive Bayes وكانت نتيجة التصنيف موضوع المقال. باستخدام 450 ملخص مقال كبيانات تدريبية و 50 ملخص مقال كبيانات اختبارية. بالإضافة إلى استخدام 5 مقالات موضوعية في هذه الدراسة. قبل التصنيف، تم إجراء التدريب على بيانات التدريب لطريقة Multinomial Naive Bayes. تنتج نتائج المعالجة المسبقة رموزًا للكلمات يمكن استخدامها كأوزان للكلمات. لترجيح الكلمات على بيانات التدريب باستخدام ترجيح TF-IDF. قبل أن يصبح المستند جاهزًا للتصنيف، يجب أن يمر بمرحلة ما قبل المعالجة. من نتائج تجارب تصنيف بيانات الاختبار التي تم إجراؤها، تم الحصول على دقة 0.99 أو 99٪، ودقة 0.98 أو 98٪، واسترجاع 0.98 أو 98٪، ومقياس f -0.98 أو 98٪.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Crysdian, Cahyo and Hanani, Ajib |
Keywords: | Klasifikasi; Multinomial Naive Bayes; TF-IDF; Classification; Multinomial Naive Bayes; TF-IDF; التصني ; Multinomial Naive Bayes ; TF-IDF |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Ilman Dwi Cahya |
Date Deposited: | 21 Aug 2023 14:40 |
Last Modified: | 21 Aug 2023 14:40 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/53705 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |