Kurniawati, Kurniawati (2016) Term weighting berbasis indeks kelas menggunakan metode tf.idf.icsδf untuk perangkingan dokumen Al-qur’an. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
12650009.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) |
Abstract
INDONESIA:
Information Retrieval berdasarkan query tertentu sudah biasa ditemukan pada sistem komputer saat ini. Salah satu metode yang popular digunakan adalah perangkingan dokumen menggunakan Vector Space Model (VSM) berbasis pada nilai pembobotan kata TF.ID. Penelitian ini menggunakan pendekatan pembobotan kata berbasis pengindeksan kelas dan membandingkan perngaruhnya pada dua metode pembobotan lain yang berbeda yang dijadikan pendekatan dasar. Metode pembobotan akan diterapkan pada dataset Al-Qur’an yang dijadikan tolak ukur koleksi. Al-Qur’an memiliki banyak ayat, masing-masing ayat dari Al-Qur’an tersebut adalah sebuah dokumen yang akan diranking berdasarkan query pengguna. TF.IDF hanya melakukan pembobotan berbasis dokumen tanpa memperhatikan kelas yang merupakan induk dokumen tersebut. Sementara pendekatan menggunakan TF.IDF.ICF hanya memperhatikan indeks kelas belum menghiraukan anggota dari setiap kelas yang menyebabkan sulit untuk membedakan frekuensi term yang jarang muncul. Oleh sebab itu diaujukan fungsi ICF yang mengimplementasikan inverse class density frequency (ICSδF), dan menghasilkan metode TF.IDF.ICSδF yang memberikan nilai diskriminasi positif pada term yang sering dan jarang muncul. Hasil penelitian menunjukkan bahwa metode yang diusulkan menghasilkan kinerja yang lebih bagus dibanding metode sebelumnya dengan nilai akurasi 93%.
ENGLISH:
Information Retrival based on specific queries is common to the current computer systems. One of the popular methods used in the document ranking method using vector space models based on TF.IDF term weighting. In this research, we introduce class-indexing-based term-weighting approaches and judges their effect two other different term weighing approaches that are considered as the baseline approaches. In the experiment, we investigate the effects of method over the Al-Qur’an datasets as benchmark collection. Al-Qur’an contain many verse, each verse of the Al-Qur’an is a single document that will be ranked based on the user query. TF.IDF method only performs term weighting based on document without regard to the indexes of the class of the document. While TF.IDF.ICF approach without any prior knowledge of the class space. Therefore, inverse class space density frequency (ICSδF) based category mapping is proposed and multiplied by TF.IDF to generate TF.IDF.ICSδF, which provide positive discrimination on rare terms in the vector space. The experimental result show that the proposed method can be implemented on document ranking and the performance are better than some previous methods with accurate value 93%.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Syauqi, A’la and Abidin, Zainal | |||||||||
Contributors: |
|
|||||||||
Keywords: | Perangkingan Dokumen; Pembobotan Kata; TF.IDF; ICF; ICSδF; Indeks Kelas; Document Ranking; Term Weighting; Class Index | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Dian Anesti | |||||||||
Date Deposited: | 25 Jul 2016 16:11 | |||||||||
Last Modified: | 25 Jul 2016 16:11 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/3759 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |