Fadlilah, Iftah Nur (2022) Pengelompokan data tweet kecelakaan menggunakan pendekatan text mining dan algoritma Birch. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
18610015.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
INDONESIA:
Kecelakaan merupakan suatu peristiwa yang tidak dapat diduga dan tidak diharapkan yang dipengaruhi oleh kendaraan bermotor serta berada di jalan raya atau tempat terbuka yang digunakan untuk tempat lalu lintas sehingga berakibat terjadinya kerusakan, luka-luka, kerugian materil dan berakibat fatal yaitu kematian. Meminimalisir tingkat kecelakaan belum dilaksanakan secara maksimal sehingga diperlukan pengelompokan dengan menggunakan metode yang sesuai dengan data yang diambil. Tujuan dari penelitian ini adalah untuk mengelompokkan data tweet kecelakaan menggunakan algoritma BIRCH. Data penelitian berupa data tweet kecelakaan yang diperoleh dari Kaggle dan crawling dari twitter. Penelitian ini menggunakan salah satu algoritma dalam data mining yang terintegrasi yakni algoritma BIRCH yang sebelumnya melalui proses pendeatan text mining. Algoritma BIRCH merupakan algoritma yang penemuan kelompok yang bagus dengan hanya menggunakan satu kali scan data. Hasil yang diperoleh dari penelitian ini adalah data yang diperoleh dari kaggle menghasilkan 1545 cluster dengan silhouette coefficient bernilai 0.1159964638217295 sedangkan dari data hasil crawling twitter menghasilkan 487 cluster dengan silhouette coefficient bernilai 0.7262655918349612.
ENGLISH:
Accident is an unexpected event that is influenced by motorized vehicles and is on a highway or open area used for traffic, resulting in damage, injury, material loss and fatal, namely death. Minimizing the accident rate has not been carried out optimally so that it is necessary to group it using a method that is in accordance with the data taken. The purpose of this study was to classify accidental tweet data using the BIRCH algorithm. Research data in the form of accident tweet data obtained from Kaggle and crawling from twitter. This study uses one of the algorithms in integrated data mining, namely the BIRCH algorithm which previously went through a text mining approach. The BIRCH algorithm is an algorithm that finds good clusters using only one scan dataThe results obtained from this study are that the data obtained from kaggle produces 1545 clusters with a silhouette coefficient of 0.1159964638217295 while the data from the Twitter crawl results produces 487 clusters with a silhouette coefficient of 0.7262655918349612.
ARABIC:
إن المصادمة هي الحادثة غير المفكرة وغير المرجوة التي يتأثرها الركوبات فى الشوارع أو الأماكن المفتوحة المستخدمة لمكان المرور حتى تسبب إلى حدوث الفساد، الجرح، الخسر حتى المصيبة العظيمة وهي الموت. إن عملية تقليل درجة المصادمة لم تقام بها كاملا حتى أنها تحتاج إلى التجميع باستخدام الطريقة المناسبة بالبيانات المأخوذة. يهدف هذا البحث لتجميع بيانات سقسق (tweet) المصادمة باستخدام ألغورتم بيرجه (Algoritma Birch). فبيانات البحث نحو بيانات سقسق (tweet) المصادمة المأخوذة من كاغيل (Kaggle) ومخدر (crawling) من توتير (twitter). استخدم هذا البحث إحدى ألغورتم فى استخراج البيانات (data mining) المترابطة وهي ألغورتم بيرجه (Algoritma Birch) مما يكون بعدها بوسيلة عملية مدخل استخراج النص (text mining). فألغورتم بيرجه (Algoritma Birch) هو ألغورتم الذي يجد التجميع الجيد ولو باستخدام مرة واحدة من البحث. فنتائج هذا البحث هي البيانات المحصولة من كاغيل (kaggle) تنتج ١٥٤٥ تجمعا (cluster) بمعامل الخيال (silhouette coefficient) له قيمة ٠.١١٥٩٩٦٤٦٣٨٢١٧٢٩ غير أن نتائج البيانات المحصولة من مخدر توتير (crawling twitter) تنتج ٤٨٧ تجمعا (cluster) بمعامل الخيال (silhouette coefficient) له قيمة ٠.٧٢٦٢٦٥٥٩١٨٣٤٩٦١٢.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Fahmi, Hisyam and Kusumastuti, Ari | |||||||||
Contributors: |
|
|||||||||
Keywords: | BIRCH; Data Mining; Kecelakaan; Text Mining; Tweet; Accident; BIRCH; Data Mining; Text Mining; Tweet بيرجه ; استخراج البيانات ; الحادثة; استخراج النص ; السقسق | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Matematika | |||||||||
Depositing User: | Iftah Nur Fadlilah | |||||||||
Date Deposited: | 07 Jul 2022 13:10 | |||||||||
Last Modified: | 07 Jul 2022 13:10 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/37052 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |