Responsive Banner

Sistem Automatic Text Summarization menggunakan Algoritma Textrank

Zamzam, Muhammad Adib (2019) Sistem Automatic Text Summarization menggunakan Algoritma Textrank. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
15650058.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB) | Preview

Abstract

مستخلص البحث

تلخيص النص هو طريقة لتلخيص أو تكثيف النص الطويل للنص الأقصر ، بحيث يمثل النص الأقصر النص الحقيقي. تلخيص النص التلقائي هو تلخيص النص الذي يتم تلقائيًا بواسطة الكمبيوتر. هناك طريقتان ، أولهما تلخيص قائم على الاستخراج وملخص تلخيصي. خوارزمي ة TextRank تعتمد على الاستخراج أو الاستخراج ، في السياق الحالي ، يعني الاستخراج اختيار وحدة النص (الجمل ، شرائح الجملة ، الفقرة أو المقاطع) ، ثم يتم حسابها واعتبارها مهمة وأخيرا يتم ترتيب الوحدات بالطريقة الصحيحة. كانت النتيجة من ٥٠ مقالًا بمعدل ملخص قدره %١٢،٥ قيمة استدعاء ROUGE بنسبة %٤١،٦٥٩. أعلى قيمة معروفة في المادة ٤٨ بقيمة ٠،٧٦٤. أقل قيمة استدعاء تذكر ROUGE في ٣٧ بقيمة ٠،١٦٧ .

ABSTRACT

Text summarization is an approach to summarize or condense long text to shorter text, so that the shorter text is represent the real text. Automatic Text Summarization is text summarization which done automatically by computer. There are two methods, first Extraction-based summarization and Abstractive summarization. TextRank Algorithm is extraction-based or extractive, in the current context, extraction means choosing the text unit (sentences, sentence segments, paragraph or passages), then it is calculated and considered as important and finally the units is arranged at the correct manner. The result from 50 articles with summary rate of 12,5% had the ROUGE recall value 41.659%. Highest value known at 48th article with value 0,764. Lowest ROUGE recall value known at 37th with value 0,167.

ABSTRAK

Text summarization (perangkuman teks) adalah pendekatan yang bisa digunakan untuk meringkas atau memadatkan teks artikel yang panjang menjadi lebih pendek dan ringkas sehingga hasil rangkuman teks yang relatif lebih pendek bisa mewakilkan teks yang panjang. Automatic Text Summarization adalah perangkuman teks yang dilakukan secara otomatis oleh komputer. Terdapat dua macam algoritma Automatic Text Summarization yaitu Extraction-based summarization dan Abstractive summarization. Algoritma TextRank merupakan algoritma extraction-based atau extractive, dimana ekstraksi di sini berarti memilih unit teks (kalimat, segmen-segmen kalimat, paragraf atau passages), lalu dianggap berisi informasi penting dari dokumen dan menyusun unit-unit (kalimat-kalimat) tersebut dengan cara yang benar. Hasil penelitian dengan input 50 artikel dan hasil rangkuman sebanyak 12,5% dari teks asli menunjukkan bahwa sistem memiliki nilai recall ROUGE 41,659 %. Nilai tertinggi recall ROUGE tertinggi tercatat pada artikel 48 dengan nilai 0,764. Nilai terendah recall ROUGE tercatat pada artikel 37 dengan nilai 0,167.

Item Type: Thesis (Undergraduate)
Supervisor: Crysdian, Cahyo and Holle, Khadijah Fahmi Hayati
Contributors:
ContributionNameEmail
UNSPECIFIEDCrysdian, CahyoUNSPECIFIED
UNSPECIFIEDHayati, Khadijah FahmiUNSPECIFIED
Keywords: تلخيص; تلخيص التلقائي; النص ; الرسم البياني; Summarization; Automatic Summarization; Text; TextRank; graph
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Purdiono Purdiono
Date Deposited: 28 May 2020 11:46
Last Modified: 04 Apr 2023 11:49
URI: http://etheses.uin-malang.ac.id/id/eprint/17470

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item