Responsive Banner

Klasifikasi berita industri menggunakan neural network

Rahma, Firda Aulia (2024) Klasifikasi berita industri menggunakan neural network. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
19650141.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (1MB) | Preview

Abstract

INDONESIA:

Berita industri memuat peristiwa-peristiwa yang sedang terjadi dunia industri. Oleh karena itu, tren-tren industri dapat dipelajari dengan menganalisis berita industri berdasarkan bidang industri tertentu. Berita industri dapat dikategorikan berdasarkan bidang-bidang industri yang sesuai dengan bantuan teknologi agar lebih efektif dan efisien. Penelitian ini menggunakan metode neural network untuk mengklasifikasikan teks berita industri ke dalam 6 sektor industri yaitu asuransi, keuangan, properti, energi, kesehatan, dan teknologi. Data artikel berita dikumpulkan melalui situs berita daring Kompas dan terdiri dari 720 data artikel industri. Data artikel diproses dengan beberapa tahap pre-processing seperti case folding, stopword removal, stemming, dan tokenisasi. Setelah pre-processing dihasilkan kumpulan kata dasar yang akan dilakukan pembobotan istilah dengan metode TF-IDF dan dihasilkan vektor TF-IDF yang akan menjadi masukan untuk neural network. Tujuan penelitian ini adalah untuk menghitung akurasi, presisi, recall, dan f1-score sebagai parameter penilaian kinerja sistem klasifikasi. Oleh karena itu, pengujian dilakukan terhadap sistem dengan tiga kali pengujian dengan pembagian proporsi data latih dan data uji sebesar 70:30; 80:20; 90:10. Kinerja terbaik didapatkan pada pengujian 90:10 dengan akurasi sebesar 93,52%; presisi sebesar 80,56%; recall sebesar 80,56%; dan 80,56% f1-score. Hasil pengujian ini menunjukkan kemampuan model dalam melakukan klasifikasi berita industri dengan data latih yang lebih besar memiliki akurasi yang cukup tinggi. Kesimpulan yang didapatkan dari hasil uji sistem klasifikasi yaitu besarnya data latih yang digunakan pada proses pembelajaran memengaruhi kinerja sistem klasifikasi. Proses pembelajaran yang lebih banyak menjadikan sistem klasifikasi memiliki perhitungan yang lebih tepat dalam menentukan klasifikasi kelas berita

ENGLISH:

Industrial news reports events occurring in the industrial world. Therefore, it can be analyzed based on certain industrial fields to learn industrial trends. It can be categorized based on suitable industrial fields assisted using technology to be more effective and efficient. The research used the neural network method to classify industrial news texts into six industrial sectors: assurance, finance, property, energy, health, and technology. The data of news articles, consisting of 720 industrial articles, were collected from the Kompas online news website. The data of articles were processed using several stages of pre-processing, such as case folding, stopword removal, stemming, and tokenization. The stage generated the collection of base words, which would be term-weighed using the TF-IDF method to create the TF-IDF vectors as neural network input. The research aims to calculate the accuracy, precision, recall, and f1-score as performance-scoring parameters for the classification system. Therefore, the system testing three times with the ratios of training and testing data are 70:30, 80:20, and 90:10. The best performance is with the testing ratio of 90:10 with an accuracy of 93.52%; the precision is 80.56%; the recall is 80.56%; and 80.56% of f1-score. The test result shows that the model's capability to classify industrial news with higher training data is quite accurate. The classification system testing result concludes that the amount of training data in the learning process influences the classification system performance. The more learning processes lead to a more precise calculation in determining the news classification.

ARABIC:

تحتوي أخبار الصناعة على أحداث تحدث في العالم الصناعي. لذلك، يمكن دراسة اتجاهات الصناعة من خلال تحليل أخبار الصناعة بناء على مجالات صناعية محددة. يمكن تصنيف أخبار الصناعة بناء على مجالات الصناعة المناسبة بمساعدة التكنولوجيا لتكون أكثر فعالية وكفاءة. استخدم هذا البحث طريقة الشبكة العصبية لتصنيف نصوص الأخبار الصناعية إلى 6 قطاعات صناعية، وهي التأمين والتمويل والممتلكات والطاقة والصحة والتكنولوجيا. تم جمع بيانات المقالات الإخبارية من خلال الموقع الإخباري عبر الإنترنت Kompas مما تتكون من 720 بيانات مقالة صناعية. تمت معالجة بيانات المقالة بعدة مراحل من المعالجة المسبقة مثل حالة قابلة للطي، استبعاد الكلمات الشائعة وغير المفيدة، الاستبعاب والترميز. بعد المعالجة المسبقة، تم إنشاء مجموعة من الكلمات الأساسية التي سيتم ترجيحها بطريقة TF-IDF ويتم إنشاء متجه TF-IDF والذي سيكون مدخلات الشبكة العصبية. الهدف من هذا البحث هو حساب الدقة والثبات والاستدعاء ودرجة ف1 كمعلمات لتقييم أداء نظام التصنيف. لذلك، تم إجراء الاختبار على النظام بثلاثة اختبارات مع تقسيم نسبة بيانات التدريب وبيانات الاختبار 70:30؛ 80:20؛ 90:10. تم الحصول على أفضل أداء في اختبار 90:10 بدقة 93.52٪، ثبات 80.56٪ ، استدعاء 80.56٪ ؛ ودرجة ف1 80.56٪. أظهرت نتائج هذا الاختبار أن قدرة النموذج على تصنيف أخبار الصناعة ببيانات تدريب أكبر لها دقة عالية جدا. الاستنتاج الذي تم الحصول عليه من نتائج اختبار نظام التصنيف هو أن كمية بيانات التدريب المستخدمة في عملية التعلم تؤثر على أداء نظام التصنيف. كلما زادت عملية التعلم تجعل نظام التصنيف لديه حسابات أكثر دقة في تحديد تصنيف فئات الأخبار

Item Type: Thesis (Undergraduate)
Supervisor: Crysdian, Cahyo and Hariyadi, Mokhamad Amin
Keywords: Neural Network; Natural Language Processing; Klasifikasi; Berita Industri; Neural Network; Natural Language Processing; Classification; Industrial News; شبكة عصبية; معالجة لغة طبيعية; تصنيف; أخبار صناعة
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: firda aulia rahma
Date Deposited: 16 Jan 2025 09:18
Last Modified: 16 Jan 2025 09:18
URI: http://etheses.uin-malang.ac.id/id/eprint/71557

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item