Aisah, Siti (2012) Text Mining dengan Algoritma Vector Space Model untuk pencarian pada Ensiklopedia Hadits berbasis Web. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Full text)
07650078.pdf - Accepted Version Restricted to Repository staff only Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (3MB) | Request a copy |
Abstract
ABSTRAK
Hadits sebagai sumber hukum Islam kedua setelah Al-Qur’an. Jika terjadi suatu permasalahan agama, maka wajib mengembalikannya kepada kitab Allah dan Sunnah Rasul-Nya. Banyak hadits yang tersebar dalam berbagai kitab sehingg menyulitkan dalam pengkategoriannya, oleh karena itu dibutuhkan media untuk menghimpun hadits dalam subyek tertentu. Media tersebut salah satunya dapat berupa ensiklopedia. Isi bahasan pada ensiklopedia yang berjumlah banyak menyulitkan pengguna dalam mengakses dan mencari informasi tertentu. Dengan perkembangan teknologi internet sekarang ini, maka dibangun ensiklopedia hadits berbasis web yang didalamnya diterapkan aplikasi pencarian. Dengan adanya aplikasi pencarian pada ensiklopedia hadits ini diharapkan dapat membantu pengguna dalam menemukan informasi sesuai permasalahan yang diajukan pengguna.
Penelitian ini menggunakan teknik text mining dengan algoritma vector space model untuk pengukuran kemiripan hasil pencarian terhadap dokumen. Teknik text mining terdapat tiga tahapan penting yaitu: text preprocessing, text transformation, dan pattern discovery. Tahapan text preprocessing terdiri tahapan pembersihan teks dan pemecahan kalimat menjadi kata-kata (tokenizing). Tahapan text transformation terdiri dari tahapan filtering dan stemming. Stemming yang digunakan dalam penelitian ini adalah stemming bahasa Indonesia algoritma Nazief Adriani. Tahapan pattern discovery adalah tahapan pembobotan, pembobotan yang digunakan yaitu pembobotan TF-IDF dan vector space model dengan metode cosine similarity.
Data yang digunakan untuk uji coba adalah kumpulan hadits dari kitab Riyadhus Shalihin. Berdasasarkan hasil pengujian untuk pencarian hadits didapatkan nilai presisi mencapai 20,79%, nilai recall mencapai 46,07%, dan akurasi mencapai 98,18%.
ABSTRACT
Hadith as a second source of Islamic law after Al-Qur'an. If there is a religious issue, it shall return it to the holy book of Allah and the Sunnah of His Prophet. Many hadiths are scattered in various holys so making it difficult for the categorization, therefore it takes the media to gather the hadith in a particular subject. Media is one of them can be an encyclopedia. Fill in the discussion of the numerous encyclopedia is making difficult for users to access and search for specific information. With the development of internet technology nowadays, then built a web-based encyclopedia hadith in which the search application implemented. With the search application on the hadith encyclopaedia is expected to assist users in finding relevant information to users posed problems.
This research uses text mining techniques with a vector space model algorithm for measuring similarity of search results against the document. Text mining techniques, there are three important stages, namely: text preprocessing, text transformation, and pattern discovery. Text preprocessing stage is the cleaning stage consists of text and split of sentences into words (tokenizing). Stages of text transformation is filtering and stemming. Stemming is used in this research is the Indonesian stemming Nazief Adriani algorithms. Stages of pattern discovery is the stage of weighting, the weighting used is the TF-IDF weighting and the vector space model with cosine similarity method.
The data used for testing is a collection of hadiths Riyadhus Shalihin. By test results for search the hadith is obtained value precision reach 20,79%, value recall reach 49,07%, and accuracy reach 98,18%.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Zaman, Syahiduz and Abidin, Zainal |
Keywords: | Ensiklopedia; Hadits; Pencarian; Text Mining; Vector Space Model; Encyclopedia; Hadith; Searching; Text Mining; Vector Space Model |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Nada Auliya Sarasawitri |
Date Deposited: | 01 Jul 2023 05:50 |
Last Modified: | 01 Jul 2023 05:50 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/50806 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |