Hasanah, Ukhty Uswatun (2022) Klasifikasi berita online menggunakan metode artificial neural network (ANN). Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
18650124.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
INDONESIA :
Pengklasifikasian dokumen berita bisa dikerjakan dengan cara otomatis menggunakan sebuah sistem, dimana sistem itu bisa mengerjakan sebuah pengklasifikasian artikel berita menurut pola yang sudah diberikan, sistem seperti ini sering disebut dengan istilah machine learning. Metode yang diterapkan dalam pembuatan sistem pada penelitian ini merupakan metode Artificial Neural Network. Tujuan dilakukannya penelitian ini untuk mengukur nilai accuracy, precision, recall, serta f-measure. Menggunakan motode ini karena kemampuannya yang dapat menyelesaikan data kompleks atau kurang tepat, metode ini mampu mendapatkan pola atau trend yang sangat kompleks agar dapat dipahami oleh sistem. Kemudian data yang digunakan untuk input pada Neural Network merupakan data yang telah melalui tahap preprocessing. Pada proses preprocessing melakukan pendekatan menggunakan Natural Language Processing (NLP) yakni tokenization, case folding, stemming, serta stopword removal. Selanjutnya data yang telah melalui tahap preprocessing akan dihitung frekuensi kemunculan kata, frekuensi inilah yang akan menjadi input pada Neural Network. Pada pengujian pertama dengan perbandingan 90:10 yaitu accuracy 96,29%, precision 83,33%, recall 83,33%, serta f-measure 83,33%. Hasil dari pengujian kedua dengan perbandingan 80:20 yaitu accuracy 92,59%, precision 66,66%, recall 66,66%, serta f-measure 66,66%. Hasil dari pengujian ketiga dengan perbandingan 70:30 yaitu accuracy 88,27%, precision 47,22%, recall 47,22%, serta f-measure 47,22%. Dari hasil pengujian tersebut data yang digunakan pada saat proses training sangat berpengaruh terhadap hasil akhir, sehingga semakin banyak data yang digunakan pada data training maka semakin baik pula hasil yang didapatkan. Hal ini disebabkan adanya pola pembelajaran pada sistem.
ENGLISH :
Classification of news documents can be done automatically using a system, where the system can classify news articles according to a given pattern, a system like this is often referred to as machine learning. The method applied in making the system in this study is the Artificial Neural Network method. The purpose of this research is to measure accuracy, precision, recall, and f-measure values. Using this method because of its ability to resolve complex or inaccurate data, this method is able to obtain very complex patterns or trends so that the system can understand them. Then the data used for input on the Neural Network is data that has gone through the preprocessing stage. In the preprocessing process, the approach is using Natural Language Processing (NLP), namely tokenization, case folding, stemming, and stopword removal. Furthermore, the data that has gone through the preprocessing stage will be calculated for the frequency of word occurrences, this frequency will be the input to the Neural Network. In the first test with a ratio of 90:10, namely 96.29% accuracy, 83.33% precision, 83.33% recall, and 83.33% f-measure. The results of the second test with a ratio of 80:20 are 92.59% accuracy, 66.66% precision, 66.66% recall, and 66.66% f-measure. The results of the third test with a ratio of 70:30 are 88.27% accuracy, 47.22% precision, 47.22% recall, and 47.22% f-measure. From the test results, the data used during the training process greatly influences the final results, so that the more data used in the training data, the better the results obtained. This is due to the pattern of learning in the system.
ARABIC:
يمكن تصنيف المستندات الإخبارية تلقائيًا باستخدام نظام التي يمكنها تصنيف
المقالات الإخبارية وفقًا لنمط معين، ويسمى هذا النظام بــ machine learning. الطريقة المطبقة في صنع النظام في هذا البحث هي طريقة الشبكة العصبية الاصطناعية. الهدف من هذا البحث هو لقياس قيم accuracy، precision، recall، وf-measure. تستخدم هذه الطريقة نظرًا لقدرتها على حل البيانات المعقدة أو غير الدقيقة، فهذه الطريقة قادرة على الحصول على أنماط أو اتجاهات معقدة للغاية حتى يتمكن النظام من فهمها. البيانات المستخدمة للإدخال إلى الشبكة العصبية هي البيانات التي مرت بمرحلة ما قبل المعالجة. في مرحلة ما قبل المعالجة باستخدام نهج معالجة اللغة الطبيعية (NLP)، وهي tokenization، case folding، stemming، وstopword removal. بعد ذلك، ستحسب البيانات التي مرت بمرحلة ما قبل المعالجة تكرار حدوث الكلمات، وسيتم إدخال التردد إلى الشبكة العصبية. في الاختبار الأول بمقارنة 90:10 حصل على النتائج accuracy 96.29٪، precision 83.33٪، recall 83.33٪، وf-measure 83.33٪. في الاختبار الثاني بمقارنة 80:20 حصل على النتائج accuracy 92.59٪، precision 66.66٪، recall 66.66٪، وf-measure 66.66٪. في الاختبار الثالث بمقارنة 70:30 حصل على النتائج accuracy 88.27٪، precision 47.22٪، recall 47.22٪، وf-measure 47.22٪. من نتائج الاختبار، تؤثر البيانات المستخدمة أثناء عملية training بشكل كبير على النتائج النهائية، لذلك كلما زادت البيانات المستخدمة في بيانات training، كانت النتائج التي تم الحصول عليها أفضل. هذا بسبب نمط التعلم في النظام.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Crysdian, Cahyo and Imamudin, Mochamad | |||||||||
Contributors: |
|
|||||||||
Keywords: | Klasifikasi Berita; Artificial Neural Network; Natural Language Processing; News Classification; Artificial Neural Network; Natural Language Processing; تصنيف الأخبار; الشبكة العصبية الاصطناعية; معالجة اللغة الطبيعية | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Ukhty Uswatun Hasanah | |||||||||
Date Deposited: | 27 Dec 2022 09:55 | |||||||||
Last Modified: | 27 Dec 2022 09:55 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/42836 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |