Responsive Banner

Ekstraksi kata kunci pada artikel menggunakan metode Textrank

Shiddiq, Muhammad Aufa (2019) Ekstraksi kata kunci pada artikel menggunakan metode Textrank. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
15650085.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (5MB)

Abstract

مستخلص البحث

في هذا العصر في تحديد الكلمات الرئيسية للمقالة العلمية مازال يقوم يدويا. يؤدي عملية تحديد الكلمات الرئيسية ليس لعا فعالة وتتطلب الكثير من الاوقات خاصةً إذا كان عدد المقالات كبيرًا جدا. من هذه المشكلات ، يلزم استخراج الكلمات الرئيسية للعثور على الكلمات الرئيسية من كثير المقالات تلقائيًا في وقت قصير. تطور العديد من الدراسات حول استخراج الكلمات الرئيسية باستخدام طرق مختلفة. إحدى الطرق الذى يستخدم كثيرا في عملية استخراج الكلمات الرئيسية هي رتبة النص. في هذا البحث، تطور استخراج الكلمات الرئيسية باستخدام طريقة رتبة النص. تتكون عملية الاستخراج من ست مراحل فهي الرمزية (Tokenization)، النابعة (Stemming )، توصيف أجزاء الكلام، البحث عن الكلمات الرئيسية المرشحة ، إنشاء الرسوم البيانية للبيانات والتصنيف باستخدام رتبة النص (TextRank). قام الباحث بتعديله في مرحلة إنشاء رسم بياني للبيانات وتصنيف رتبة النص للحصول على أفضل النتيجة في وقت أقصر.دلت نتائج اختبار النظام باستخدام بيانات 50 مقالات إلى أن الخوارزمية المعدلة تحصل على أعلى قيم الدقة وأقصر أوقات الاستخراج مقارنةً بخوارزمية رتبة النص (TextRank ) الأصلية

ABSTRACT

Currently in determining keywords for scientific articles is still done manually. This causes the process of determining keywords to be ineffective and requires a lot of time especially if the number of articles is very large. Of these problems, keyword extraction is needed to find keywords from many articles automatically in a short time. Various studies on keyword extraction have been developed using various methods. One method that is widely used in the keyword extraction process is TextRank. In this study keyword extraction was developed using the TextRank method. The extraction process consists of six process including Tokenization, Stemming, Parts-of-Speech Tagging, searching for candidate keywords, creating graph data and ranking using TextRank. The researcher modified it at creating a data graph and TextRank ranking process to get better results with a shorter time. The results of testing using data from 50 articles shows that the modified algorithms achieve higher accuracy values and shorter extraction times than the original TextRank algorithm

ABSTRAK

Saat ini dalam menentukan kata kunci untuk artikel ilmiah masih dilakukan secara manual. Hal ini menyebabkan proses penentuan kata kunci menjadi tidak efektif dan membutuhkan banyak waktu terlebih lagi jika jumlah artikelnya sangat banyak. Dari permasalahan tersebut, ekstraksi kata kunci diperlukan untuk menemukan kata kunci dari banyak artikel secara otomatis dalam waktu yang singkat. Berbagai penelitian mengenai ekstraksi kata kunci telah dikembangkan dengan memanfaatkan berbagai metode. Salah satu metode yang banyak digunakan dalam proses ekstraksi kata kunci yaitu TextRank. Pada penelitian ini ekstraksi kata kunci dikembangkan menggunakan metode TextRank. Proses ekstraksi terdiri dari enam tahapan antara lain Tokenization, Stemming, Parts-of-Speech Tagging, pencarian kandidat kata kunci, membuat data graph dan perankingan menggunakan TextRank. Peneliti melakukan modifikasi pada tahap membuat data graph dan perankingan TextRank untuk mendapatkan hasil yang lebih baik dengan waktu yang lebih singkat. Hasil pengujian sistem menggunakan data 50 artikel menunjukkan bahwa algoritma yang telah dimodifikasi memperoleh nilai akurasi lebih tinggi serta waktu ekstraksi yang lebih singkat dibandingkan dengan algoritma TextRank yang asli

Item Type: Thesis (Undergraduate)
Supervisor: Crysdian, Cahyo and Imamudin, Mochamad
Contributors:
ContributionNameEmail
UNSPECIFIEDCrysdian, CahyoUNSPECIFIED
UNSPECIFIEDImamuddin, MochamadUNSPECIFIED
Keywords: استخراج الكلمات الرئيسية; رتبة النص; النابعة; توصيف أجزاء الكلام; مرشح التعبير الكلمات المتعددة; الرسم البياني; Keyword Extraction; TextRank; Stemming; Parts-of-Speech Tagging; Multiword expression candidate; graph; Ekstraksi Kata Kunci; TextRank; Stemming; Parts-of-Speech Tagging; Multiword expression candidate; graph
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Mohammad Syahriel Ar
Date Deposited: 30 Apr 2020 13:00
Last Modified: 09 Jun 2023 14:42
URI: http://etheses.uin-malang.ac.id/id/eprint/17153

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item