Setyaningrum, Qorina (2024) Klasifikasi kecelakaan kerja pada berita online menggunakan multinomial naive bayes. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
200605110120.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (3MB) |
Abstract
INDONESIA:
Portal berita online berperan penting dalam menyediakan informasi aktual dan faktual kepada masyarakat mengenai berbagai isu, salah satunya kecelakaan kerja yang merupakan permasalahan serius di lingkup industri karena berdampak pada keselamatan dan produktivitas pekerja. Dengan meningkatnya kasus kecelakaan kerja secara global maupun nasional, diperlukan tindakan pencegahan dengan mengklasifikasikan jenis kecelakaan kerja di berbagai sektor melalui portal berita online. Namun, klasifikasi manual saat ini memakan waktu dan rentan kesalahan. Penelitian ini bertujuan untuk mengukur kinerja Multinomial Naïve Bayes (MNB) dalam mengklasifikasikan berita kecelakaan kerja dan menganalisis faktor-faktor yang mempengaruhi kinerja tersebut. Dataset diolah melalui tahap preprocessing, yaitu cleaning, case folding, tokenizing, stopwords removal, dan stemming. Selanjutnya, data hasil preprocessing dihitung tiap kemunculan kata pada setiap dokumen melalui ekstraksi fitur TF-IDF yang dikonversi menjadi data diskrit dengan dikategorikan dalam 20 rentang. Hasil inilah yang digunakan sebagai input pada metode MNB. Hasil penelitian menunjukkan bahwa nilai akurasi tertinggi sebesar 88% pada rasio 90:10. Pengujian k-fold cross validation dengan nilai k=10 menunjukkan rata-rata akurasi sebesar 84% dengan akurasi tertinggi pada iterasi ke-9 sebesar 89.58%. Selain itu didapatkan hasil bahwa faktor-faktor yang mempengaruhi kinerja MNB dalam proses klasifikasi yaitu penggunaan rasio data pelatihan dan data pengujian, pemilihan fitur, serta karateristik dataset.
ENGLISH:
Online news portals play an important role in providing actual and factual information to the public on various issues, one of which is work accidents which are a serious problem in the industrial sphere because they have an impact on worker safety and productivity. With the increasing cases of work accidents globally and nationally, preventive measures are needed by classifying the types of work accidents in various sectors through online news portals. However, current manual classification is time-consuming and error-prone. This study aims to measure the performance of Multinomial Naïve Bayes (MNB) in classifying work accident news and analyze the factors that affect the performance. The dataset is processed through the preprocessing stage, namely cleaning, case folding, tokenizing, stopwords removal, and stemming. Furthermore, the preprocessing data is calculated for each word occurrence in each document through TF-IDF feature extraction which is converted into discrete data by being categorized in 20 ranges. These results are used as input to the MNB method. The results showed that the highest accuracy value was 88% at a ratio of 90:10. Testing k-fold cross validation with a value of k = 10 shows an average accuracy of 84% with the highest accuracy at the 9th iteration of 89.58%. In addition, it was found that the factors that affect the performance of MNB in the classification process are the use of the ratio of training data and test data, feature selection, and dataset characteristics.
ARABIC:
تلعب البوابات الإخبارية على الإنترنت دورًا مهمًا في توفير المعلومات الفعلية والواقعية للجمهور حول مختلف القضايا، ومن بينها حوادث العمل التي تعد مشكلة خطيرة في المجال الصناعي لما لها من تأثير على سلامة العمال وإنتاجيتهم. مع تزايد حالات حوادث العمل على الصعيدين العالمي والوطني، هناك حاجة إلى اتخاذ تدابير وقائية من خلال تصنيف أنواع حوادث العمل في مختلف القطاعات من خلال البوابات الإخبارية على الإنترنت. ومع ذلك، فإن التصنيف اليدوي الحالي يستغرق وقتًا طويلاً وعرضة للأخطاء. تهدف هذه الدراسة إلى قياس أداء برنامج "تعدد الحدود الساذجة" (MNB) في تصنيف أخبار حوادث العمل وتحليل العوامل التي تؤثر على الأداء. تتم معالجة مجموعة البيانات من خلال مرحلة المعالجة المسبقة، وهي التنظيف، وطيّ الحالات، والترميز، وإزالة الكلمات المتوقفة، والوقف. علاوةً على ذلك، يتم حساب بيانات المعالجة المسبقة لكل كلمة واردة في كل مستند من خلال استخراج ميزة TF-IDF التي يتم تحويلها إلى بيانات منفصلة من خلال تصنيفها في 20 نطاقًا. تُستخدم هذه النتائج كمدخلات لطريقة MNB. أظهرت النتائج أن أعلى قيمة دقة كانت 88% بنسبة 90:10. يُظهر اختبار التحقق التبادلي المضاعف k بقيمة k = 10 متوسط دقة 84% مع أعلى دقة عند التكرار التاسع بنسبة 89.58%. بالإضافة إلى ذلك، وُجد أن العوامل التي تؤثر على أداء MNB في عملية التصنيف هي استخدام نسبة بيانات التدريب وبيانات الاختبار، واختيار الميزات، وخصائص مجموعة البيانات.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Crysdian, Cahyo and Hariyadi, M. Amin |
Keywords: | Kecelakaan Kerja; Klasifikasi Berita; Multinomial Naïve Bayes; News Classification; Occupational Accidents; حوادث العمل; تصنيف الأخبار; تصنيف الأخبار; بايز ساذج متعدد الحدود |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | qorina setyaningrum |
Date Deposited: | 25 Jul 2024 08:59 |
Last Modified: | 25 Jul 2024 08:59 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/66032 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |