Twitter text mining untuk informasi gempa bumi menggunakan TF-IDF di Indonesia

Fattah, Rijaalul (2016) Twitter text mining untuk informasi gempa bumi menggunakan TF-IDF di Indonesia. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
09650040.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB)

Abstract

INDONESIA:

Text Mining atau Penambangan Teks adalah proses yang dilakukan oleh komputer untuk mendapatkan sesuatu yang baru, atau menemukan kembali informasi yang tersirat secara implisit. Penelitian ini membahas mengenai penambangan teks kemudian difilter untuk mendapatkan informasi mengenai gempa bumi di Indonesia. Tujuan yang ingin didapatkan adalah memperoleh informasi tentang terjadinya gempa bumi dari media sosial secara akurat. Aplikasi ini dibangun menggunakan bahasa Python sebagai bahasa pemrogramannya. Untuk uji cobanya dilakukan dengan men-stream web Twitter menggunakan kata kunci “gempa” kemudian di-crawl. Dokumen yang dihasilkan dari proses stream twitter API dilakukan penghitungan bobot tf-idf.

Dari hasil uji coba pada proses uji coba, didapatkan bahwa proses stream menghasilkan 520 dokumen tweet dengan kata kunci gempa. Kemudian oleh aplikasi dokumen tersebut dihitung kemunculan term gempa pada setiap dokumen. Dari 520 dokumen tweet yang dihasilkan, freakuensi rata-rata tweet yang dihasilkan dalam satu menit adalah 1 tweet dengan bobot tf-idf 0.036. Frekuensi kemunculan term divisualkan dalam bentuk chart time series yang menunjukkan kemunculan term gempa pada tiap menit.

ENGLISH:

Text Mining is the process that performed by a computer to get something new, or find back information that implied implicitly. This research discussed about text mining then filtered it to get information of the earth quake in Indonesia. The goal is to get obtain information about the earthquake of social media accurately . This application is build on Python as the programming language. The test process is by doing some twitter stream using keyword “gempa” then crawl it. Documents produced from the twitter API stream process count of tf-idf weight.

From the trial at process trial, got that process stream produce 520 documents tweets keyword earthquake. Then by the application of the documents calculated the term earthquake in each document. From the 520 documents of the tweet that produced, the average frecuency of tweets generated in one minute is one tweet with tf-idf weight of 0.036. Frequency of occurrence visualized term in the chart time series showing the term earthquake in every minutes.

Item Type: Thesis (Undergraduate)
Supervisor: Hariyadi, M. Amin and Mardhiyah, Ainatul
Keywords: Twitter; Text Mining; Gempa Bumi; TF-IDF; Earth Quake
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Zulaikha Zulaikha
Date Deposited: 29 Jul 2016 05:56
Last Modified: 29 Jul 2016 05:56
URI: http://etheses.uin-malang.ac.id/id/eprint/3948

Actions (login required)

View Item View Item