Ansori, Yusuf (2022) Implementasi metode Support Vector Machine dengan seleksi fitur Information Gain pada klasifikasi berita online. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
18650041.pdf - Accepted Version Restricted to Repository staff only Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Request a copy |
Abstract
INDONESIA:
Berita menjadi salah satu media informasi yang dapat disampaikan dalam bentuk teks. Jumlahnya semakin meningkat seiring dengan banyaknya peristiwa yang terjadi pada suatu waktu. Umumnya, berita yang disajikan terbagi menjadi beberapa kategori, seperti kategori nasional, internasional, ekonomi, olahraga, teknologi, dan lain sebagainya. Hal tersebut ditujukan untuk memudahkan pembaca dalam memilih berita. Adanya data berita yang besar dan terdiri dari beberapa kategori menjadi permasalahan jika dilakukan secara manual. Saat ini, teknologi dapat dimanfaatkan untuk membuat sebuah sistem klasifikasi berita yang dapat menentukan kategori secara otomatis. Metode Support Vector Machine (SVM) dipilih untuk menyelesaikan masalah klasifikasi berita karena memiliki kemampuan tinggi untuk memodelkan hubungan yang kompleks dan non-linear pada data yang berdimensi tinggi. Selain itu, metode seleksi fitur Information Gain (IG) digunakan untuk mengatasi permasalahan yang disebabkan oleh banyaknya fitur yang terbentuk pada data teks berita. Tujuan dari penelitian ini adalah untuk mengukur akurasi, presisi, recall, dan f-measure pada sistem klasifikasi berita. Pada klasifikasi menggunakan metode SVM, menghasilkan nilai akurasi sebesar 94,04%, presisi 85%, recall 85%, dan f-measure 85%. Sedangkan pada klasifikasi menggunakan metode SVM dengan 70% fitur terbaik yang dihasilkan dari seleksi fitur IG menghasilkan nilai akurasi 96.8%, presisi 92%, recall 92%, dan f-measure 92%. Penggunaan seleksi fitur IG mampu meningkatkan nilai akurasi sebesar 2.76%, presisi 7%, recall 7%, dan f-measure sebesar 7%. Berdasarkan pada hasil yang didapatkan, dapat diketahui bahwa penggunaan metode seleksi fitur IG dapat mempengaruhi kinerja dari sistem klasifikasi berita.
ENGLISH:
News is one of the information media that can be conveyed in text form. The number increases with the number of events that occur at a time. Generally, the news presented is divided into several categories, such as national, international, economic, sports, technology, etc. This is intended to make it easier for readers to choose news. The existence of large news data consisting of several categories is a problem if it is done manually. Currently, technology can be used to create a news classification system that can determine categories automatically. The Support Vector Machine (SVM) method was chosen to solve news classification problems because it has a high ability to model complex and non-linear relationships in high-dimensional data. In addition, the Information Gain (IG) feature selection method is used to overcome problems caused by the many features formed in news text data. The purpose of this research is to measure the accuracy, precision, recall, and f-measure of the news classification system. In the classification using the SVM method, it produces an accuracy value of 94.04%, 85% precision, 85% recall, and 85% f-measure. While the classification using the SVM method with the best 70% of the features resulting from the selection of IG features produces an accuracy of 96.8%, 92% precision, 92% recall, and 92% f-measure. Using the Information Gain selection feature can increase the accuracy value by 2.76%, precision by 7%, recall by 7%, and f-measure by 7%. Based on the results obtained, it can be seen that the use of the IG feature selection method can affect the performance of the news classification system.
ARABIC:
الخبر أحد من وسائل المعلومات المنتشرة بالنص. وجملته مرتفعة بجسب تنافر الحوادث الواقعة في الاوقات. الخبر منتشر من الأصناف أساسا, كصنفة وطنية والدولية والاقتصادية والرياضية والتكنولوجية وغير ذالك. وهذا التصنيف يجر على تسهيل القراء في اختيار الأخبار. البيانات الأخبارية الكبرى ينقسم إلى الأصناف يوجد إشكالا في التصنيف اليدوي. التكنولوجيا مفيد في اتخاذ جهاز تصنيف الأخبار بدلالة أصنافها الآلية. Support Vector Machine (SVM) طريقة مختار لحل المشكلات في تصنيف الأخبار لأن له إدراك جالي لتشكيل المناسبة الشاملة وغير خطي من البيانات الكبرى. لحل المشكلات بسبب كثرة الميزة المشكلة Information Gain ومن غيره ميزة تصنيف نسبة المعلومات مستخدمة في جهاز نصوص الأخبار.وغرض البحث أن يحاسب الدقة والضبط واعد الاتصال وf-measure في تصنيف الأخبار. وأما التصنيف باستخدام SVMتحصل به النتيجة من الدقة ٩٤،٤٪ والضبط ٨٥٪ والاسترجاع ٨٥٪ وf-measure ٨٥٪. بينما ينتج عن التصنيف باستخدام طريقة SVM مع أفضل ٧٠٪ من الميزات الناتجة عن اختيار ميزات IG الدقة ٩٦،٨٪ والضبط ٩٢٪ والاسترجاع ٩٢٪ و ٩٢٪f-measure . يمكن أن يؤدي استخدام ميزة تحديد كسب المعلومات إلى زيادة قيمة الدقة بنسبة ٢،٧٦٪ ، والضبط بنسبة ٧٪ ، والاسترجاع بنسبة ٧٪ ،f-measure بنسبة ٧٪. بناءً على النتائج التي تم الحصول عليها ، بهذا، علمنا أن استخدام طريقة اختيار ميزة IG يمكن أن يؤثر على أداء جهاز تصنيف الأخبار.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Crysdian, Cahyo and Syauqi, A’la | |||||||||
Contributors: |
|
|||||||||
Keywords: | Klasifikasi berit; Support Vector Machine; Seleksi Fitur; Information Gain; Multiclass; News Classification; Support Vector Machine; Feature Selection; Information Gain; Multiclass Classification; تصنيف الأخبار; Support Vector Machine; نسبة المعلومات،; Information Gain; تعدد الاصناف; | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Yusuf Ansori | |||||||||
Date Deposited: | 21 Feb 2023 09:31 | |||||||||
Last Modified: | 18 Apr 2023 08:59 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/43067 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |