Responsive Banner

Implementasi model BART berbasis Transfer Learning untuk ringkasan transkrip video YouTube dan evaluasi kualitas dengan metrik ROUGE

Setiawan, Diyan Nova (2026) Implementasi model BART berbasis Transfer Learning untuk ringkasan transkrip video YouTube dan evaluasi kualitas dengan metrik ROUGE. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
230605210022.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(7MB)

Abstract

ABSTRAK

Transkrip video YouTube yang dihasilkan secara otomatis umumnya memiliki  struktur panjang dan kurang terorganisir, sehingga menyulitkan pengguna dalam  memahami inti informasi secara cepat dan efisien. Penelitian ini bertujuan untuk  mengimplementasikan model BART berbasis Transfer Learning dalam melakukan  peringkasan otomatis terhadap transkrip video YouTube berbahasa Indonesia serta  mengevaluasi kualitas ringkasan yang dihasilkan menggunakan metrik ROUGE.  Metode penelitian meliputi pengambilan data transkrip melalui YouTube API,  proses preprocessing teks untuk membersihkan dan menormalisasi data, finetuning model BART menggunakan pendekatan Transfer Learning, serta evaluasi  menggunakan ROUGE-1, ROUGE-2, dan ROUGE-L berdasarkan nilai Precision, Recall, dan F1-Score. Data penelitian berasal dari 730 video pada channel edukatif  “Kok Bisa?” yang dikategorikan berdasarkan durasi menjadi pendek, sedang, dan  panjang untuk menganalisis pengaruh panjang transkrip terhadap performa model.  Hasil penelitian menunjukkan bahwa model BART berbasis Transfer Learning mampu menghasilkan ringkasan yang informatif dan relevan dengan performa  evaluasi yang konsisten pada berbagai kategori durasi. Dengan demikian, sistem  yang dikembangkan dapat meningkatkan aksesibilitas informasi serta mendukung  pemahaman konten video secara lebih cepat dan praktis melalui aplikasi web  berbasis Flask.

مستخلص البحث

تتميز النصوص التفريغية التلقائية لمقاطع فيديو يوتيوب بطولها وضعف تنظيمها، مما يجعل من الصعب على المستخدمين فهم المعلومات الأساسية بسرعة وكفاءة. تهدف هذه الدراسة إلى تطبيق نموذج بارت القائم على أسلوب نقل التعلّم في تلخيص نصوص مقاطع فيديو يوتيوب باللغة الإندونيسية تلخيصًا آليًا، مع تقييم جودة الملخصات الناتجة باستخدام مقياس روج.
تضمنت منهجية البحث استرجاع بيانات النصوص التفريغية عبر واجهة برمجة تطبيقات يوتيوب، وإجراء المعالجة المسبقة للنصوص بهدف تنظيف البيانات وتوحيد صيغتها، ثم تنفيذ عملية الضبط الدقيق لنموذج بارت باستخدام منهج نقل التعلّم، إضافة إلى إجراء التقييم باستخدام مقاييس روج-١ وروج-٢ وروج-ل اعتمادًا على قيم الدقة والاسترجاع ومتوسط الدرجة التوافقية (إف-١).
استندت بيانات البحث إلى ٧٣٠ مقطع فيديو من قناة تعليمية، صُنِّفت وفق مدة العرض إلى قصيرة ومتوسطة وطويلة لتحليل تأثير طول النص التفريغي في أداء النموذج. وأظهرت النتائج أن نموذج بارت القائم على نقل التعلّم قادر على إنتاج ملخصات مفيدة ومرتبطة بالسياق، مع أداء تقييم متسق عبر مختلف فئات المدة. وبذلك يسهم النظام المطوَّر في تحسين إتاحة المعلومات ودعم الفهم السريع والعملي لمحتوى الفيديو من خلال تطبيق ويب قائم على إطار عمل فلاسك.

الكلمات المفتاحية: بارت، نقل التعلّم، تلخيص النصوص، النص التفريغي لليوتيوب، روج.

ABSTRACT

Auto-generated YouTube video transcripts generally have a long structure and  are less organized, making it difficult for users to understand the core information  quickly and efficiently. This study aims to implement a Transfer Learning-based  BART model in automatically summarizing Indonesian YouTube video transcripts  and evaluating the quality of summaries produced using the ROUGE metric. The  research methods included retrieval of transcript data through the YouTube API,  text preprocessing process to clean and normalize the data, fine-tuning the BART model using the Transfer Learning approach, and evaluation using ROUGE-1,  ROUGE-2, and ROUGE-L based on Precision, Recall, and F1-Score values. The research data came from 730 videos on the educational channel "Kok Bisa?" which  were categorized by duration into short, medium, and long to analyze the effect of  transcript length on model performance. The results showed that the Transfer  Learning-based BART model was able to produce informative and relevant  summaries with consistent evaluation performance across various duration  categories. Thus, the developed system can improve information accessibility and  support faster and practical understanding of video content through a Flask-based  web application.

Item Type: Thesis (Masters)
Supervisor: Faisal, Muhammad and Imamudin, Mochamad
Keywords: BART, Transfer Learning, Text Summarization, YouTube Transcript, ROUGE. بارت، نقل التعلّم، تلخيص النصوص، النص التفريغي لليوتيوب، روج. BART, Transfer Learning, Text Summarization, YouTube Transcript, ROUGE.
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing
08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080108 Neural, Evolutionary and Fuzzy Computation
10 TECHNOLOGY > 1005 Communications Technologies > 100509 Video Communications
Departement: Fakultas Sains dan Teknologi > Jurusan Magister Tehnik Informatika
Depositing User: Diyan Nova Setiawan
Date Deposited: 21 Apr 2026 08:34
Last Modified: 21 Apr 2026 08:34
URI: http://etheses.uin-malang.ac.id/id/eprint/84197

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item