Sabrani, Ivan Bintang (2024) Implementasi algoritma K-prototype pada pengelompokan data pelanggaran lalu lintas di kota Malang. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Full Text)
210601110076.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (4MB) | Preview |
Abstract
INDONESIA:
Penelitian ini bertujuan mengelompokkan data pelanggaran lalu lintas di Kota Malang tahun 2021. Data mining menjadi salah satu teknik penting dalam analisis data skala besar untuk mengidentifikasi pola-pola berharga yang dapat mendukung pengambilan keputusan. Salah satu metode dalam data mining adalah clustering, yang digunakan untuk mengelompokkan data berdasarkan kesamaan karakteristik. Algoritma K-Prototype diterapkan untuk melakukan clustering pada data pelanggaran lalu lintas, yang melibatkan atribut numerik dan kategorikal. Data yang digunakan meliputi 7.328 kasus dengan lima atribut utama: pasal yang dilanggar, barang bukti, jenis kendaraan, formulir tilang, dan jumlah denda. Proses penelitian meliputi transformasi data, normalisasi atribut numerik, dan implementasi algoritma K-Prototype. Evaluasi menggunakan Within-Cluster Sum of Squares (WCSS) untuk memastikan kualitas clustering. Dihasilkan klaster terbaik sebanyak empat euclidian. Hasil pengelompokan ini menghasilkan klaster-klaster yang menggambarkan pola pelanggaran spesifik. Klaster 0 (4117 kasus) dan klaster 1 (1230 kasus) didominasi pelanggaran sepeda motor, dengan pelanggaran terbanyak pada Pasal 287(1) di klaster 0 dan Pasal 285(1) di klaster 1. klaster 2 (1337 kasus) dan klaster 3 (510 kasus) didominasi kendaraan roda empat, dengan pelanggaran terbanyak pada Pasal 287(1) di klaster 2 dan Pasal 286 di klaster 3. Hasilnya diharapkan menjadi referensi untuk upaya peningkatan kesadaran berlalu lintas serta perencanaan kebijakan yang lebih efektif dalam mengurangi angka pelanggaran dan kecelakaan di masa depan.
ENGLISH:
This research aims to group traffic violation data in Malang City in 2021. Data mining is one of the important techniques in large-scale data analysis to identify valuable patterns that can support decision making. One method in data mining is clustering, which is used to group data based on similar characteristics. The K-Prototype algorithm is applied to cluster traffic violation data, which involves numeric and categorical attributes. The data used includes 7.328 cases with five main attributes: the violated article, evidence, type of vehicle, ticket form, and amount of fine. The research process includes data transformation, normalization of numeric attributes, and implementation of the K-Prototype algorithma. Evaluation using Within-Cluster Sum of Squares (WCSS) to ensure clustering quality. The best clusters produced were four clusters. The results of this clustering produce clusters that describe specific violation patterns. Cluster 0 (4117 cases) and cluster 1 (1230 cases) are dominated by motorcycle violations, with the most violations being Article 287(1) in cluster 0 and Article 285(1) in Cluster 1. Cluster 2 (1337 cases) and Cluster 3 (510 cases) are dominated by four-wheeled vehicles, with the most violations being Article 287(1) in Cluster 2 and Article 286 in Cluster 3. The results are expected to be a reference for efforts to increase traffic awareness and more effective policy planning in reducing the number of violations and accidents in the future.
ARABIC:
يهدف هذا البحث إلى تجميع بيانات المخالفات المرورية في مدينة مالانج في عام ٢٠٢١. يعد التنقيب عن البيانات أحد التقنيات المهمة في تحليل البيانات على نطاق واسع لتحديد الأنماط القيمة التي يمكن أن تدعم عملية صنع القرار. إحدى طرق التنقيب عن البيانات هي التجميع ، والذي يستخدم لتجميع البيانات بناء على خصائص التشابه. يتم تطبيق خوارزمية K-Prototype على بيانات انتهاك حركة مرور نظام المجموعة، والتي تتضمن سمات رقمية وفئوية. تضمنت البيانات المستخدمة ٧٣٢٨ حالة بخمس سمات رئيسية: المواد المنتهكة ، والأدلة ، ونوع السيارة ، واستمارة التذكرة ، ومقدار الغرامات. تتضمن عملية البحث تحويل البيانات ، وتطبيع السمات العددية ، وتنفيذ خوارزميات K-Prototype. يستخدم التقييم مجموع المربعات داخل نظام المجموعة (WCSS) لضمان جودة التجميع. تم إنتاج أفضل المجموعات ما يصل إلى أربعة مجموعات. تنتج نتائج هذا التجميع مجموعات تصف أنماط انتهاك محددة. وتهيمن مخالفات الدراجات النارية على المجموعة ٠ (٤١١٧حالة) والمجموعة ١ (١٢٣٠حالة)، حيث ترتكب معظم الانتهاكات في المادة ٢٨٧ (١) في المجموعة ٠ والمادة ٢٨٥ (١) في المجموعة ١. وتهيمن المركبات ذات الأربع عجلات على المجموعة ٢ (١٣٣٧حالة) والمجموعة ٣ (٥١٠ حالات)، ومعظم الانتهاكات هي المادة ٢٨٧ (١) في المجموعة ٢ والمادة ٢٨٦ في المجموعة ٣. ومن المتوقع أن تكون النتائج مرجعا للجهود المبذولة لزيادة الوعي المروري بالإضافة إلى تخطيط سياسات أكثر فعالية في الحد من عدد المخالفات والحوادث في المستقبل.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Fahmi, Hisyam and Alisah, Evawati |
Keywords: | K-Prototype; Clustering; Pelanggaran Lalu lintas; Kota Malang, Data mining; K-Prototype; Clustering; Traffic Violations; Malang City; Data mining;النماذج الأولية K ; استخراج البيانات ; المخالفات المرورية ; مالانج ; نعدين اليانات |
Departement: | Fakultas Sains dan Teknologi > Jurusan Matematika |
Depositing User: | IVAN BINTANG SABRANI |
Date Deposited: | 13 Jan 2025 11:26 |
Last Modified: | 13 Jan 2025 11:26 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/71191 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |