Responsive Banner

Klasifikasi penyebab kecelakaan lalu lintas pada berita online menggunakan metode neural network

Saputra, Abdillah Bagus (2025) Klasifikasi penyebab kecelakaan lalu lintas pada berita online menggunakan metode neural network. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
210605110134.pdf - Published Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(2MB) | Preview

Abstract

INDONESIA:
Keselamatan lalu lintas masih menjadi tantangan utama di Indonesia dengan 79.220 kecelakaan tercatat per Agustus 2024, dimana 76,42% melibatkan sepeda motor. Penelitian ini bertujuan mengukur kinerja model Artificial Neural Network (ANN) dalam mengklasifikasikan berita kecelakaan lalu lintas online berdasarkan metrik accuracy, precision, recall, dan F1-Score. Data penelitian berupa berita kecelakaan lalu lintas dari Detik, Kompas, dan CNN Indonesia periode 2020-2025 yang dikumpulkan melalui web scraping dan diklasifikasikan menjadi tiga kategori: Kelalaian Pengemudi, Faktor Kendaraan, dan Faktor Jalan. Preprocessing data meliputi case folding, tokenisasi, dan stopword removal. Ekstraksi fitur menggunakan FastText untuk representasi numerik, serta teknik SMOTE untuk mengatasi ketidakseimbangan kelas. Arsitektur ANN menggunakan hidden layer dengan fungsi aktivasi ReLU dan Softmax. Pengujian dilakukan dalam empat skenario dengan variasi jumlah node hidden layer (21 dan 301) dan Learning rate (0.001 dan 0.0001). Model tanpa SMOTE mencapai akurasi tertinggi 78% namun mengalami kesulitan dalam mendeteksi kelas minoritas. Penerapan SMOTE meningkatkan kinerja secara signifikan dengan akurasi tertinggi 82%, precision 0.72, recall 0.73, dan F1-Score 0.71 pada konfigurasi 301 node dengan learning rate 0.001. Penelitian ini menunjukkan bahwa model ANN dengan kombinasi FastText efektif untuk klasifikasi berita kecelakaan lalu lintas, dan penerapan teknik SMOTE sangat diperlukan untuk mengatasi masalah ketidakseimbangan data guna mencapai performa optimal.

ENGLISH:
Traffic safety remains a significant challenge in Indonesia, with 79,220 recorded accidents involving motorcycles as of August 2024, 76.42%. This study aims to measure the performance of Artificial Neural Network (ANN) models in classifying online traffic accident news based on accuracy, precision, recall, and F1-Score metrics. The research data consists of traffic accident news from Detik, Kompas, and CNN Indonesia from 2020-2025 collected through web scraping and classified into three categories: Driver Negligence, Vehicle Factors, and Road Factors. Data preprocessing includes case folding, tokenization, and stopword removal, while feature extraction uses FastText for numerical representation and the SMOTE technique to address class imbalance. The ANN architecture employs hidden layers with ReLU and Softmax activation functions, tested in four scenarios with variations in the number of hidden layer nodes (21 and 301) and Learning rates (0.001 and 0.0001). Models without SMOTE achieved a maximum accuracy of 78% but struggled with minority class detection. SMOTE implementation substantially improved performance with the highest accuracy of 82%, precision of 0.72, recall of 0.73, and F1-Score of 0.71 using 301 nodes with a 0.001 Learning rate. This research demonstrates that ANN models combined with FastText effectively classify traffic accident news. Implementing the SMOTE technique is essential to address data imbalance issues for optimal performance.

ARABIC:
لا تزال السلامة المرورية تمثل تحديًا كبيرًا في إندونيسيا حيث تم تسجيل 79,220 حادثًا حتى أغسطس 2024، منها 76,42% منها تتعلق بالدراجات النارية. تهدف هذه الدراسة إلى قياس أداء نموذج الشبكة العصبية الاصطناعية (ANN) في تصنيف أخبار الحوادث المرورية عبر الإنترنت بناءً على مقاييس الدقة والدقة والاستدعاء وF1-Score. بيانات البحث هي في شكل أخبار الحوادث المرورية من ديتيك وكومباس وسي إن إن إندونيسيا للفترة 2020-2025 التي تم جمعها من خلال كشط الويب وتصنيفها إلى ثلاث فئات: إهمال السائق، وعوامل المركبة، وعوامل الطريق. وتتضمن المعالجة المسبقة للبيانات طي الحالات وترميزها وإزالة كلمات التوقف. يستخدم استخلاص الميزات تقنية FastText للتمثيل العددي، بالإضافة إلى تقنية SMOTE لمعالجة اختلال التوازن بين الفئات. تستخدم بنية الشبكة العصبية الاصطناعية طبقة مخفية مع دوال تنشيط ReLU و Softmax. تم إجراء الاختبار في أربعة سيناريوهات مع اختلافات في عدد عقد الطبقة المخفية (21 و301) ومعدل التعلم (0.001 و0.0001). حقق النموذج بدون SMOTE أعلى دقة بنسبة 78% ولكنه واجه صعوبة في اكتشاف فئات الأقلية. أدى تطبيق SMOTE إلى تحسين الأداء بشكل كبير مع أعلى دقة بنسبة 82%، ودقة 0.72، واستدعاء 0.73، ودرجة F1- Score 0.71 في تكوين 301 عقدة بمعدل تعلم 0.001. تظهر هذه الدراسة أن نموذج ANN المدمج مع FastText فعال في تصنيف أخبار الحوادث المرورية، وأن تطبيق تقنية SMOTE ضروري للتغلب على مشكلة عدم توازن البيانات من أجل تحقيق الأداء الأمثل.

Item Type: Thesis (Undergraduate)
Supervisor: Crysdian, Cahyo and Imamudin, Mochamad
Keywords: Artificial Neural Network; FastText; SMOTE; klasifikasi berita; kecelakaan lalu lintas; ketidakseimbangan kelas; Artificial Neural Network; FastText; SMOTE; news classification; traffic accidents; class imbalance;الشبكة العصبية الاصطناعية ; FastText ; SMOTE;تصنيف الأخبار ;الحوادث المرورية ;اختلالالتوازنالطبقي
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Abdillah Bagus Saputra
Date Deposited: 22 Aug 2025 09:55
Last Modified: 22 Aug 2025 09:55
URI: http://etheses.uin-malang.ac.id/id/eprint/76750

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item