Zamzam, Muhammad Adib (2019) Sistem Automatic Text Summarization menggunakan Algoritma Textrank. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
15650058.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
مستخلص البحث
تلخيص النص هو طريقة لتلخيص أو تكثيف النص الطويل للنص الأقصر ، بحيث يمثل النص الأقصر النص الحقيقي. تلخيص النص التلقائي هو تلخيص النص الذي يتم تلقائيًا بواسطة الكمبيوتر. هناك طريقتان ، أولهما تلخيص قائم على الاستخراج وملخص تلخيصي. خوارزمي ة TextRank تعتمد على الاستخراج أو الاستخراج ، في السياق الحالي ، يعني الاستخراج اختيار وحدة النص (الجمل ، شرائح الجملة ، الفقرة أو المقاطع) ، ثم يتم حسابها واعتبارها مهمة وأخيرا يتم ترتيب الوحدات بالطريقة الصحيحة. كانت النتيجة من ٥٠ مقالًا بمعدل ملخص قدره %١٢،٥ قيمة استدعاء ROUGE بنسبة %٤١،٦٥٩. أعلى قيمة معروفة في المادة ٤٨ بقيمة ٠،٧٦٤. أقل قيمة استدعاء تذكر ROUGE في ٣٧ بقيمة ٠،١٦٧ .
ABSTRACT
Text summarization is an approach to summarize or condense long text to shorter text, so that the shorter text is represent the real text. Automatic Text Summarization is text summarization which done automatically by computer. There are two methods, first Extraction-based summarization and Abstractive summarization. TextRank Algorithm is extraction-based or extractive, in the current context, extraction means choosing the text unit (sentences, sentence segments, paragraph or passages), then it is calculated and considered as important and finally the units is arranged at the correct manner. The result from 50 articles with summary rate of 12,5% had the ROUGE recall value 41.659%. Highest value known at 48th article with value 0,764. Lowest ROUGE recall value known at 37th with value 0,167.
ABSTRAK
Text summarization (perangkuman teks) adalah pendekatan yang bisa digunakan untuk meringkas atau memadatkan teks artikel yang panjang menjadi lebih pendek dan ringkas sehingga hasil rangkuman teks yang relatif lebih pendek bisa mewakilkan teks yang panjang. Automatic Text Summarization adalah perangkuman teks yang dilakukan secara otomatis oleh komputer. Terdapat dua macam algoritma Automatic Text Summarization yaitu Extraction-based summarization dan Abstractive summarization. Algoritma TextRank merupakan algoritma extraction-based atau extractive, dimana ekstraksi di sini berarti memilih unit teks (kalimat, segmen-segmen kalimat, paragraf atau passages), lalu dianggap berisi informasi penting dari dokumen dan menyusun unit-unit (kalimat-kalimat) tersebut dengan cara yang benar. Hasil penelitian dengan input 50 artikel dan hasil rangkuman sebanyak 12,5% dari teks asli menunjukkan bahwa sistem memiliki nilai recall ROUGE 41,659 %. Nilai tertinggi recall ROUGE tertinggi tercatat pada artikel 48 dengan nilai 0,764. Nilai terendah recall ROUGE tercatat pada artikel 37 dengan nilai 0,167.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Crysdian, Cahyo and Holle, Khadijah Fahmi Hayati | |||||||||
Contributors: |
|
|||||||||
Keywords: | تلخيص; تلخيص التلقائي; النص ; الرسم البياني; Summarization; Automatic Summarization; Text; TextRank; graph | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Purdiono Purdiono | |||||||||
Date Deposited: | 28 May 2020 11:46 | |||||||||
Last Modified: | 04 Apr 2023 11:49 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/17470 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |