Shiddiq, Muhammad Aufa (2019) Ekstraksi kata kunci pada artikel menggunakan metode Textrank. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
15650085.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (5MB) |
Abstract
مستخلص البحث
في هذا العصر في تحديد الكلمات الرئيسية للمقالة العلمية مازال يقوم يدويا. يؤدي عملية تحديد الكلمات الرئيسية ليس لعا فعالة وتتطلب الكثير من الاوقات خاصةً إذا كان عدد المقالات كبيرًا جدا. من هذه المشكلات ، يلزم استخراج الكلمات الرئيسية للعثور على الكلمات الرئيسية من كثير المقالات تلقائيًا في وقت قصير. تطور العديد من الدراسات حول استخراج الكلمات الرئيسية باستخدام طرق مختلفة. إحدى الطرق الذى يستخدم كثيرا في عملية استخراج الكلمات الرئيسية هي رتبة النص. في هذا البحث، تطور استخراج الكلمات الرئيسية باستخدام طريقة رتبة النص. تتكون عملية الاستخراج من ست مراحل فهي الرمزية (Tokenization)، النابعة (Stemming )، توصيف أجزاء الكلام، البحث عن الكلمات الرئيسية المرشحة ، إنشاء الرسوم البيانية للبيانات والتصنيف باستخدام رتبة النص (TextRank). قام الباحث بتعديله في مرحلة إنشاء رسم بياني للبيانات وتصنيف رتبة النص للحصول على أفضل النتيجة في وقت أقصر.دلت نتائج اختبار النظام باستخدام بيانات 50 مقالات إلى أن الخوارزمية المعدلة تحصل على أعلى قيم الدقة وأقصر أوقات الاستخراج مقارنةً بخوارزمية رتبة النص (TextRank ) الأصلية
ABSTRACT
Currently in determining keywords for scientific articles is still done manually. This causes the process of determining keywords to be ineffective and requires a lot of time especially if the number of articles is very large. Of these problems, keyword extraction is needed to find keywords from many articles automatically in a short time. Various studies on keyword extraction have been developed using various methods. One method that is widely used in the keyword extraction process is TextRank. In this study keyword extraction was developed using the TextRank method. The extraction process consists of six process including Tokenization, Stemming, Parts-of-Speech Tagging, searching for candidate keywords, creating graph data and ranking using TextRank. The researcher modified it at creating a data graph and TextRank ranking process to get better results with a shorter time. The results of testing using data from 50 articles shows that the modified algorithms achieve higher accuracy values and shorter extraction times than the original TextRank algorithm
ABSTRAK
Saat ini dalam menentukan kata kunci untuk artikel ilmiah masih dilakukan secara manual. Hal ini menyebabkan proses penentuan kata kunci menjadi tidak efektif dan membutuhkan banyak waktu terlebih lagi jika jumlah artikelnya sangat banyak. Dari permasalahan tersebut, ekstraksi kata kunci diperlukan untuk menemukan kata kunci dari banyak artikel secara otomatis dalam waktu yang singkat. Berbagai penelitian mengenai ekstraksi kata kunci telah dikembangkan dengan memanfaatkan berbagai metode. Salah satu metode yang banyak digunakan dalam proses ekstraksi kata kunci yaitu TextRank. Pada penelitian ini ekstraksi kata kunci dikembangkan menggunakan metode TextRank. Proses ekstraksi terdiri dari enam tahapan antara lain Tokenization, Stemming, Parts-of-Speech Tagging, pencarian kandidat kata kunci, membuat data graph dan perankingan menggunakan TextRank. Peneliti melakukan modifikasi pada tahap membuat data graph dan perankingan TextRank untuk mendapatkan hasil yang lebih baik dengan waktu yang lebih singkat. Hasil pengujian sistem menggunakan data 50 artikel menunjukkan bahwa algoritma yang telah dimodifikasi memperoleh nilai akurasi lebih tinggi serta waktu ekstraksi yang lebih singkat dibandingkan dengan algoritma TextRank yang asli
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Crysdian, Cahyo and Imamudin, Mochamad | |||||||||
Contributors: |
|
|||||||||
Keywords: | استخراج الكلمات الرئيسية; رتبة النص; النابعة; توصيف أجزاء الكلام; مرشح التعبير الكلمات المتعددة; الرسم البياني; Keyword Extraction; TextRank; Stemming; Parts-of-Speech Tagging; Multiword expression candidate; graph; Ekstraksi Kata Kunci; TextRank; Stemming; Parts-of-Speech Tagging; Multiword expression candidate; graph | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Mohammad Syahriel Ar | |||||||||
Date Deposited: | 30 Apr 2020 13:00 | |||||||||
Last Modified: | 09 Jun 2023 14:42 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/17153 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |