Peringkas teks otomatis menggunakan Tanimoto distance jaccard similarity dan pembobotan frekuensi kemunculan kata untuk dokumen berita berbahasa Indonesia dan Inggris

Ardhy, Y. Wardata (2015) Peringkas teks otomatis menggunakan Tanimoto distance jaccard similarity dan pembobotan frekuensi kemunculan kata untuk dokumen berita berbahasa Indonesia dan Inggris. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
09650210.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (5MB) | Preview

Abstract

INDONESIA:

Peringkasan teks merupakan proses penyusutan teks sumber untuk dijadikan ke dalam teks yang lebih pendek namun tetap mempertahankan informasi yang terkandung didalamnya.

Penelitian ini membahas mengenai peringkasan halaman web berita berdasarkan kandungan intisari yaitu isi (content) berita menggunakan metode Tanimoto Distance Jaccard Similarity dan pembobotan frekuensi kata. Tujuan yang ingin dicapai adalah meringkas halaman web berita secara otomatis untuk mempermudah proses pencarian inti dari informasi berita. Aplikasi dibangun menggunakan bahasa Java sebagai bahasa pemrograman. Uji coba dilakukan dengan mengukur akurasi peringkasan dengan membandingkan ringkasan aplikasi dengan ringkasan manual yang dibuat oleh manusia menggunakan perhitungan f-measure.

Dari hasil uji coba, didapatkan bahwa peringkasan menghasilkan tingkat akurasi f-measure sebesar 55% untuk berita berbahasa indonesia dan 63% untuk berita berbahasa inggris. Hal tersebut menunjukkan bahwa sistem dengan penggabungan 2 metode ini cukup efektif dalam mengambil inti dari sebuah berita yang sama dengan yang diambil manual oleh manusia sebagai ringkasan.

ENGLISH:

Text Summarization is shrinking process of text source into the shorter text but still retains the information contained.

This study discusses the Summarization o f the news web pages based on the content of the essence news uses the Tanimoto Distance Jaccard Similarity and word frequency weighting. The goal was to summarize the news web pages automatically to simplify the process of finding a core of news information. Applications was built using the Java language as a programming language. The test was done by measuring the accuracy of the summary by comparing the summary application with a summary of the manual created by humans using the f-measure calculation.

From the test results, it was found that the summary generatedf-measure accuracy rate of 55% for Indonesian language news and 63% for English-language news. It showed that the system by merging of two of themethod were quite effective in taking the essence of same news that taken manually by humans as a summary.

Item Type: Thesis (Undergraduate)
Supervisor: Abidin, Zainal and Crysdian, Cahyo
Keywords: Peringkasan Teks; Halaman Web; Text Summarizing; Web Pages; Bobot Kalimat; Sentence Weight; Sentence Based Summarization; Tanimoto Distance Jaccard Similarity
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Dian Anesti
Date Deposited: 13 Oct 2017 07:09
Last Modified: 13 Oct 2017 07:09
URI: http://etheses.uin-malang.ac.id/id/eprint/8167

Actions (login required)

View Item View Item