Savila, Aisya Gusti (2025) Peingkasan teks cerita islam berbahasa Indonesia menggunakan long short term memory (LSTM). Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim Malang.
![]() |
Text (Fulltext)
210605110045.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (6MB) |
Abstract
INDONESIA :
Panjangnya narasi dalam cerita-cerita sering menjadi kendala bagi banyak pembaca, terutama mereka yang memiliki keterbatasan waktu atau kesulitan memahami isi cerita secara keseluruhan. Dalam hal ini, peringkasan menjadi solusi yang membantu, namun peringkasan manual tidak selalu efisien dalam memenuhi kebutuhan informasi yang cepat dan ringkas. Penelitian ini bertujuan untuk mengembangkan sistem peringkasan teks otomatis pada cerita-cerita Islam menggunakan algoritma Long Short Term Memory (LSTM). Penelitian ini menggunakan tiga skenario pembagian data pelatihan dan pengujian, yaitu 90:10, 80:20, dan 70:30. Hasil pengujian menunjukkan bahwa akurasi pelatihan tertinggi dicapai pada skenario 80:20 dengan nilai sebesar 89,44%. Hal ini tidak sepenuhnya menunjukkan bahwa proporsi data latih yang lebih kecil akan selalu menghasilkan akurasi lebih tinggi, karena peningkatan ini dapat dipengaruhi oleh variasi data, kondisi overfitting, dan kinerja early stopping. Oleh karena itu, rasio pembagian data memberikan pengaruh terhadap proses pelatihan. Meskipun akurasi pelatihan tertinggi diperoleh pada skenario 80:20, kualitas ringkasan secara semantik dengan performa terbaik terdapat pada skenario 90:10. Pada skenario 90:10 tersebut, nilai evaluasi ROUGE-1 mencapai precision sebesar 0,4147, sebesar 0,2516, dan F1-score sebesar 0,3027. Sedangkan ROUGE-2, mencapai precision sebesar 0,1022, sebesar 0,0568, dan F1-score sebesar 0,0684. Sementara itu, pada ROUGE-L dicapai precision sebesar 0,2017, sebesar 0,1209, dan F1-score sebesar 0,1459.
ENGLISH :
The length of narratives in stories often becomes a challenge for many readers, especially those with limited time or difficulty in comprehending the entire content. In this context, summarization becomes a helpful solution. However, manual summarization is not always efficient in meeting the need for quick and concise information. This study aims to develop an automatic text summarization system for Islamic stories using the Long Short Term Memory (LSTM) algorithm. The study employs three training and testing data split scenarios: 90:10, 80:20, and 70:30. The experimental results show that the highest training accuracy was achieved in the 80:20 scenario, with a value of 89.44%. This does not entirely indicate that a smaller training data proportion will always yield higher accuracy, as this increase may be influenced by data variation, overfitting conditions, and early stopping performance. Therefore, the data split ratio has an impact on the training process. Although the highest training accuracy was obtained in the 80:20 scenario, the best semantic summary quality was found in the 90:10 scenario. In this 90:10 scenario, the ROUGE-1 evaluation achieved a precision of 0.4147, recall of 0.2516, and F1-score of 0.3027. Meanwhile, ROUGE-2 achieved a precision of 0.1022, recall of 0.0568, and F1-score of 0.0684. For ROUGE-L, a precision of 0.2017, recall of 0.1209, and F1-score of 0.1459 were obtained.
ARABIC :
غالبًا ما تُشكّل طول السرد في القصص تحديًا لكثير من القراء، خاصةً أولئك الذين يعانون من ضيق الوقت أو صعوبة في فهم محتوى القصة بشكل كامل. في هذا السياق، تُعدّ عملية التلخيص حلاً مساعدًا، إلا أن التلخيص اليدوي لا يكون دائمًا فعالًا في تلبية الحاجة إلى المعلومات السريعة والموجزة. يهدف هذا البحث إلى تطوير نظام تلخيص تلقائي للنصوص في القصص الإسلامية باستخدام خوارزمية الذاكرة طويلة وقصيرة المدى (LSTM). استخدم البحث ثلاث سيناريوهات لتقسيم بيانات التدريب والاختبار، وهي 90:10 و80:20 و70:30. أظهرت نتائج الاختبار أن أعلى دقة تدريب تم تحقيقها في سيناريو 80:20 بنسبة بلغت 89.44%. ومع ذلك، لا يدل هذا تمامًا على أن نسبة بيانات التدريب الأقل تؤدي دائمًا إلى دقة أعلى، إذ قد تتأثر هذه الزيادة بتنوع البيانات، وحالات الإفراط في التعلُّم (overfitting)، وأداء التوقف المبكر (early stopping). وبالتالي، فإن نسبة تقسيم البيانات تؤثر على عملية التدريب. وعلى الرغم من تحقيق أعلى دقة تدريب في سيناريو 80:20، فإن أفضل جودة للتلخيص من الناحية الدلالية تحققت في سيناريو 90:10. ففي هذا السيناريو، حقّق تقييم ROUGE-1 دقة (precision) بنسبة 0.4147 واسترجاع (recall) بنسبة 0.2516، ودرجة F1 بمقدار 0.3027. بينما حقق ROUGE-2 دقة بنسبة 0.1022، واسترجاعًا بنسبة 0.0568، ودرجة F1 بمقدار 0.0684. أما في ROUGE-L، فقد تم الوصول إلى دقة بنسبة 0.2017، واسترجاع بنسبة 0.1209، ودرجة F1 بمقدار 0.1459.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Supriyono, Supriyono and Melani, Roro Inda |
Keywords: | LSTM; peringkasan teks; ROUGE-L; ROUGE-N; teknologi digital; teks cerita islam; LSTM; text summarization; ROUGE-L; ROUGE-N; digital technology; Islamic story text; LSTM; تلخيص النص, ROUGE-L, ROUGE-N, التكنولوجيا الرقمية, نص القصة الإسلامية |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Aisya Gusti Savila |
Date Deposited: | 04 Sep 2025 09:49 |
Last Modified: | 04 Sep 2025 09:49 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/79073 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |