Setiawan, Diyan Nova (2026) Implementasi model BART berbasis Transfer Learning untuk ringkasan transkrip video YouTube dan evaluasi kualitas dengan metrik ROUGE. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
230605210022.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (7MB) |
Abstract
ABSTRAK
Transkrip video YouTube yang dihasilkan secara otomatis umumnya memiliki struktur panjang dan kurang terorganisir, sehingga menyulitkan pengguna dalam memahami inti informasi secara cepat dan efisien. Penelitian ini bertujuan untuk mengimplementasikan model BART berbasis Transfer Learning dalam melakukan peringkasan otomatis terhadap transkrip video YouTube berbahasa Indonesia serta mengevaluasi kualitas ringkasan yang dihasilkan menggunakan metrik ROUGE. Metode penelitian meliputi pengambilan data transkrip melalui YouTube API, proses preprocessing teks untuk membersihkan dan menormalisasi data, finetuning model BART menggunakan pendekatan Transfer Learning, serta evaluasi menggunakan ROUGE-1, ROUGE-2, dan ROUGE-L berdasarkan nilai Precision, Recall, dan F1-Score. Data penelitian berasal dari 730 video pada channel edukatif “Kok Bisa?” yang dikategorikan berdasarkan durasi menjadi pendek, sedang, dan panjang untuk menganalisis pengaruh panjang transkrip terhadap performa model. Hasil penelitian menunjukkan bahwa model BART berbasis Transfer Learning mampu menghasilkan ringkasan yang informatif dan relevan dengan performa evaluasi yang konsisten pada berbagai kategori durasi. Dengan demikian, sistem yang dikembangkan dapat meningkatkan aksesibilitas informasi serta mendukung pemahaman konten video secara lebih cepat dan praktis melalui aplikasi web berbasis Flask.
مستخلص البحث
تتميز النصوص التفريغية التلقائية لمقاطع فيديو يوتيوب بطولها وضعف تنظيمها، مما يجعل من الصعب على المستخدمين فهم المعلومات الأساسية بسرعة وكفاءة. تهدف هذه الدراسة إلى تطبيق نموذج بارت القائم على أسلوب نقل التعلّم في تلخيص نصوص مقاطع فيديو يوتيوب باللغة الإندونيسية تلخيصًا آليًا، مع تقييم جودة الملخصات الناتجة باستخدام مقياس روج.
تضمنت منهجية البحث استرجاع بيانات النصوص التفريغية عبر واجهة برمجة تطبيقات يوتيوب، وإجراء المعالجة المسبقة للنصوص بهدف تنظيف البيانات وتوحيد صيغتها، ثم تنفيذ عملية الضبط الدقيق لنموذج بارت باستخدام منهج نقل التعلّم، إضافة إلى إجراء التقييم باستخدام مقاييس روج-١ وروج-٢ وروج-ل اعتمادًا على قيم الدقة والاسترجاع ومتوسط الدرجة التوافقية (إف-١).
استندت بيانات البحث إلى ٧٣٠ مقطع فيديو من قناة تعليمية، صُنِّفت وفق مدة العرض إلى قصيرة ومتوسطة وطويلة لتحليل تأثير طول النص التفريغي في أداء النموذج. وأظهرت النتائج أن نموذج بارت القائم على نقل التعلّم قادر على إنتاج ملخصات مفيدة ومرتبطة بالسياق، مع أداء تقييم متسق عبر مختلف فئات المدة. وبذلك يسهم النظام المطوَّر في تحسين إتاحة المعلومات ودعم الفهم السريع والعملي لمحتوى الفيديو من خلال تطبيق ويب قائم على إطار عمل فلاسك.
الكلمات المفتاحية: بارت، نقل التعلّم، تلخيص النصوص، النص التفريغي لليوتيوب، روج.
ABSTRACT
Auto-generated YouTube video transcripts generally have a long structure and are less organized, making it difficult for users to understand the core information quickly and efficiently. This study aims to implement a Transfer Learning-based BART model in automatically summarizing Indonesian YouTube video transcripts and evaluating the quality of summaries produced using the ROUGE metric. The research methods included retrieval of transcript data through the YouTube API, text preprocessing process to clean and normalize the data, fine-tuning the BART model using the Transfer Learning approach, and evaluation using ROUGE-1, ROUGE-2, and ROUGE-L based on Precision, Recall, and F1-Score values. The research data came from 730 videos on the educational channel "Kok Bisa?" which were categorized by duration into short, medium, and long to analyze the effect of transcript length on model performance. The results showed that the Transfer Learning-based BART model was able to produce informative and relevant summaries with consistent evaluation performance across various duration categories. Thus, the developed system can improve information accessibility and support faster and practical understanding of video content through a Flask-based web application.
| Item Type: | Thesis (Masters) |
|---|---|
| Supervisor: | Faisal, Muhammad and Imamudin, Mochamad |
| Keywords: | BART, Transfer Learning, Text Summarization, YouTube Transcript, ROUGE. بارت، نقل التعلّم، تلخيص النصوص، النص التفريغي لليوتيوب، روج. BART, Transfer Learning, Text Summarization, YouTube Transcript, ROUGE. |
| Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080108 Neural, Evolutionary and Fuzzy Computation 10 TECHNOLOGY > 1005 Communications Technologies > 100509 Video Communications |
| Departement: | Fakultas Sains dan Teknologi > Jurusan Magister Tehnik Informatika |
| Depositing User: | Diyan Nova Setiawan |
| Date Deposited: | 21 Apr 2026 08:34 |
| Last Modified: | 21 Apr 2026 08:34 |
| URI: | http://etheses.uin-malang.ac.id/id/eprint/84197 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |
