Fauzi, Deri (2023) Peringkasan teks multi dokumen berbahasa Indonesia menggunakan Sentence Scoring dan Support Vector Machine (SVM). Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
19650074.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
INDONESIA:
Berita online berasal dari berbagai sumber portal berita yang tersedia secara luas di dunia maya. Namun, berita online yang melimpah dapat mengesampingkan detail dan keakuratan berita karena tujuannya untuk memberikan informasi terkini sebanyak mungkin. Ketersediaan berita online di internet dapat menyebabkan penerimaan informasi yang berlebihan, memberikan pemahaman yang kurang jelas mengenai substansi berita tersebut. Oleh karena itu, penting untuk menemukan representasi dokumen berita online guna memahami inti dari berita tersebut.
Penelitian ini fokus pada menghasilkan ringkasan berita online multi dokumen dari ekstraksi fitur dan proses klasifikasi menggunakan support vector machine. penelitian ini mengklasifikan berita multi dokumen menggunakan ekstraksi fitur Sentence Scoring dan SVM. Sentence Scoring digunakan untuk input pada metode SVM agar dapat melakukan proses klasifikasi untuk menentukan hasil ringkasan.
Hasil pengujian menunjukkan bahwa Fold 3 memberikan hasil terbaik, dengan rata-rata Recall 0.946, Presisi 0.487, dan F-Measure 0.634. ROUGE-1 juga mencapai nilai tertinggi pada Fold 3, yaitu 0.946. Faktor kunci dalam hasil peringkasan adalah proses ekstraksi fitur menggunakan Sentence Scoring dan pelatihan data dengan SVM. Fitur seperti data numerik dan kemiripan antar kalimat berpengaruh signifikan terhadap hasil akhir dari peringkasan.
ENGLISH:
Online news originates from various news portal sources widely available on the internet. However, the abundance of online news may overlook details and accuracy in favor of providing the most up-to-date information. The availability of online news on the internet can lead to information overload, resulting in a vague understanding of the news substance. Therefore, it is crucial to find a representation of online news documents to comprehend the core of the news.
This research focuses on generating multi-document online news summaries through feature extraction and classification processes using support vector machines (SVM). The study classifies multi-document news using Sentence Scoring feature extraction and SVM classification processes. Sentence Scoring is employed as input for the SVM method to perform the classification process to determine summary outcomes.
Test results indicate that Fold 3 yields the best results, with an average Recall of 0.946, Presicion of 0.487, and F-Measure of 0.634. ROUGE-1 also achieves the highest value in Fold 3, which is 0.946. Key factors in the summarization results include the feature extraction process using Sentence Scoring and training data with SVM. Features such as numerical data and Sentence similarity significantly influence the final summarization outcomes
ARABIC:
تصدر الأخبار عبر الإنترنت من مصادر مختلفة من بوابات الأخبار المتوفرة على نطاق واسع في العالم الافتراضي. ومع ذلك ، يمكن أن تتجاهل الأخبار عبر الإنترنت الغنية التفاصيل والدقة للأخبار لأنها تهدف إلى تقديم أكبر قدر ممكن من المعلومات في أسرع وقت ممكن. يمكن أن تؤدي توفر الأخبار عبر الإنترنت على الإنترنت إلى قبول المعلومات المفرط ، مما يوفر فهمًا غير واضح للمضمون الإخباري. لذلك ، من المهم العثور على تمثيل لوثائق الأخبار عبر الإنترنت لفهم جوهر الأخبار.
يركز هذا البحث على إنتاج ملخصات للأخبار عبر الإنترنت متعددة الوثائق من استخراج الميزات وعملية التصنيف باستخدام آلة دعم المتجهات. يقوم هذا البحث بتصنيف الأخبار متعددة الوثائق باستخدام استخراج الميزات Sentence Scoring و SVM. يتم استخدام Sentence scoring كمدخل لطريقة SVM حتى تتمكن من إجراء عملية التصنيف لتحديد نتيجة الملخص.
أظهرت نتائج الاختبار أن الطية 3 قدمت أفضل النتائج ، بمتوسط استدعاء 0.946 ، ودقة 0.487 ، وقياس F 0.634. كما وصل ROUGE-1 إلى أعلى قيمة في الطية 3 ، وهي 0.946. العامل الرئيسي في نتيجة الملخص هو عملية استخراج الميزات باستخدام Sentence scoring وتدريب البيانات باستخدام SVM. تؤثر الميزات مثل البيانات الرقمية والتشابه بين الجمل بشكل كبير على النتيجة النهائية للملخص
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Abidin, Zainal and Fatchurrochman, Fatchurrochman |
Keywords: | peringkasan teks; multi dokumen; SVM; berita online Text Summarization; Multi Document; SVM; Online News تلخيص النصوص ; مستندات متعددة ; آلة دعم املتجهات ; أخبار اإلنرتنت |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Deri Fauzi |
Date Deposited: | 13 Feb 2024 13:29 |
Last Modified: | 13 Feb 2024 13:29 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/59635 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |