Rhosady, Verry Prima Anindya (2013) Rancang bangun aplikasi pengklasifikasian halaman Web berdasarkan content menggunakan metode cosine similarity. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
09650187.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (4MB) | Preview |
Abstract
INDONESIA:
Klasifikasi adalah proses pengelompokan beberapa objek menjadi sebuah grup berdasarkan ciri-ciri dari objek tersebut.
Penelitian ini membahas mengenai pengklasifikasian halaman web berdasarkan kandungan intisari yaitu isi (content) menggunakan metode Cosine Similarity. Tujuan yang ingin dicapai adalah mengklasifikasikan halaman web secara otomatis untuk keperluan data mining serta mempermudah proses pencarian informasi. Aplikasi dibangun menggunakan bahasa Java sebagai bahasa pemrograman dan Framework JADE sebagai sistem terdistribusi berbasis agent. Uji coba dilakukan dengan meng-crawl 1 web dan menetukan 8 kategori yang masing-masing kategori memiliki 3 data training yang diambil dari web itu sendiri secara manual.
Dari hasil uji coba pada proses uji coba, didapatkan bahwa proses crawl menghasilkan 107 dokumen web artikel, 91 dokumen web navigasi, dan ditambah dengan 3 dokumen web artikel input manual. Dan dari 110 dokumen web, 33 dokumen web memiliki kategori yang sesuai dengan web aslinya. Sedangkan 77 dokumen web tidak sesuai
ENGLISH:
Classification is a process of grouping several objects into a group based on the characteristics of the object.
This study discusses about classification of web pages based on the content that is the essence of the content using Cosine Similarity method. The Objectives is to classify web pages automatically for purposes of data mining and information retrieval process easier. Applications built using the Java language as a programming language and framework JADE as agent-based distributed systems. The test is done by crawling a web and determine 8 categories, each category has 3 training data are taken from the web it self manually.
From the test results on the test, it was found that crawl the web document produced 107 articles, 91 Web document navigation, and coupled with article 3 web document input manually. And of 110 web documents, web document has 33 categories according to the original web. 77 While not appropriate web documents
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Abidin, Zainal and Fatchurrochman, Fatchurrochman | |||||||||
Contributors: |
|
|||||||||
Keywords: | Klasifikasi; Halaman Web; Cosine Simil Arity; Lassification; Web Pages; Cosine Simil Arity | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Sri Widiyanah | |||||||||
Date Deposited: | 03 Aug 2017 09:51 | |||||||||
Last Modified: | 03 Aug 2017 09:51 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/7564 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |