Cahyani, Vivin Octavia (2024) Peringkasan teks ekstraktif karya ilmiah mahasiswa menggunakan Fuzzy C-Means dan Vector Space Model. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
210605110038.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (3MB) |
Abstract
INDONESIA:
Artikel jurnal ilmiah terus meningkat setiap tahunnya, sering kali mempersulit pembaca dalam menyaring informasi inti secara efisien. Informasi yang kurang efisien membuat pembaca harus membaca ulang artikel sehingga memerlukan banyak waktu. Oleh karena itu, dibutuhkan sebuah alat untuk menemukan inti informasi dari artikel jurnal ilmiah secara cepat dan efisien. Untuk mengatasi masalah ini, peringkasan teks otomatis diperlukan, khususnya untuk artikel jurnal ilmiah berbahasa indonesia. Penelitian ini mengembangkan sistem peringkasan teks otomatis menggunakan metode Fuzzy C-Means dan Vector Space Model menggunakan pembobotan kalimat TF-IDF (Term Frequency Invers Document Frequency). Evaluasi sistem menggunakan metrik ROUGE-1 dan ROUGE-2. Hasil pengujian menunjukkan bahwa sistem terbaik, pada tingkat kompresi 30% serta menggunakan stemming memberikan hasil terbaik dan seimbang, dengan rata-rata ROUGE-1 Precision 0.5331, Recall 0.5034, F1-Score 0.4975 dan Accuracy 0.5183. Hasil penelitian ini menunjukkan bahwa model dengan stemming lebih disarankan untuk menghasilkan ringkasan yang lebih relevan dan akurat pada tingkat kompresi yang lebih tinggi.
ENGLISH:
Scientific journal articles increase yearly, often making it difficult for readers to sift through the core information efficiently. Inefficient information makes the reader have to re-read the article, which takes a lot of time. Therefore, a tool is needed to find the core information of scientific journal articles quickly and efficiently. To solve this problem, automatic text summarization is needed, especially for Indonesian scientific journal articles. This research develops an automatic text summarization system using the Fuzzy C-Means method and Vector Space Model using TF-IDF (Term Frequency Inverse Document Frequency) sentence weighting. The system evaluation uses ROUGE-1 and ROUGE-2 metrics. The test results show that the best system, at 30% compression level and using stemming gives the best and balanced results, with an average ROUGE-1 Precision of 0.5331, Recall of 0.5034, F1-Score 0.4975, and Accuracy of 0.5183. The results of this study show that the model with stemming is recommended to produce more relevant and accurate summaries at higher compression levels.
ARABIC:
تستمر مقالات المجلة العلمية في الزيادة كل عام، مما يجعل من الصعب على القراء في التدقيق بكفاءة في المعلومات الأساسية. المعلومات الأقل كفاءة تجعل القراء يضطرون إلى إعادة قراءة المقالة، لذا يستغرق الأمر الكثير من الوقت. لذلك، هناك حاجة إلى أداة للعثور بسرعة على المعلومات الأساسية من مقالات المجلة العلمية. لحل هذه المشكلة، هناك حاجة إلى تلخيص تلقائي للنص، خاصة بالنسبة لمقالات المجلات العلمية الإندونيسية. طور هذا البحث نظاما آليا لتلخيص النص باستخدام طريقة خوارزمية العنقدة الضبابية والوسطاء المتعددين ونموذج فضاء المتجه من خلال ترجيح كلمة TF-IDF (معدل تكرار الكلمة الواحدة في المستند الواحد). استخدم تقييم النظام مقاييس ROUGE-1 و ROUGE-2. أظهرت نتائج الاختبار أن النظام بنسبة ضغط 30٪ وباستخدام جذع الكلمة أعطى أفضل النتائج وأكثرها توازنا، بمتوسط لـ ROUGE-1 هو الثبات 0.53331، والاستدعاء 0.5034، ودرجة ف1 0.4975، ودقة 0.5183. أشارت نتائج هذا البحث إلى أن النماذج ذات جذع الكلمة موصى بها أكثر لإنتاج ملخصات أكثر صلة ودقة بمستويات ضغط أعلى.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Faisal, Muhammad and Santoso, Irwan Budi |
Keywords: | Fuzzy C-Means; Vector Space Model; Peringkasan Teks; Fuzzy C-Means; Vector Space Model; Text Summarization; خوارزمية عنقدة ضبابية ووسطاء متعددين ; نموذج فضاء متجه; تلخيص نص |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Vivin Cahyani |
Date Deposited: | 05 May 2025 08:16 |
Last Modified: | 05 May 2025 09:54 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/74293 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |