Al, Humayroh (2026) Chatbot pembelajaran bahasa Arab berbasis NLP menggunakan Fine-Tuning AraBERT. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
220605110150.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (1MB) |
Abstract
INDONESIA:
Penelitian ini bertujuan untuk mengembangkan chatbot pembelajaran bahasa Arab berbasis Natural Language Processing menggunakan metode fine-tuning AraBERT untuk klasifikasi jenis kata bahasa Arab berupa isim, fi’il, dan harf. Sistem dikembangkan menggunakan dataset Morphologically and Syntactically Annotated Quran Dataset (MASAQ) dan diimplementasikan ke dalam chatbot interaktif berbasis web. Hasil implementasi menunjukkan bahwa chatbot mampu melakukan analisis jenis kata bahasa Arab secara otomatis pada kalimat bahasa Arab baku (Modern Standard Arabic/MSA) secara cukup konsisten. Hasil evaluasi model menunjukkan nilai F1-score sebesar 0.990538 pada proses klasifikasi token bahasa Arab. Selain itu, hasil evaluasi implementasi chatbot pada 15 kalimat bahasa Arab menunjukkan tingkat akurasi klasifikasi token sebesar 92.54% dengan 62 token berhasil diklasifikasikan secara benar dari total 67 token yang diuji. Kesalahan klasifikasi umumnya terjadi pada token berbentuk klitik dan partikel pendek seperti huruf sambung serta prefiks yang melekat pada kata dasar. Secara keseluruhan, sistem mampu membantu proses pembelajaran dasar bahasa Arab serta memberikan analisis klasifikasi kata secara otomatis dan interaktif.
ENGLISH:
This research aims to develop an Arabic learning chatbot based on Natural Language Processing using the AraBERT fine-tuning method for classifying Arabic word categories into isim, fi’il, and harf. The system was developed using the Morphologically and Syntactically Annotated Quran Dataset (MASAQ) and implemented into an interactive web-based chatbot. The implementation results show that the chatbot is capable of automatically analyzing Arabic word categories in Modern Standard Arabic (MSA) sentences consistently. The model evaluation results achieved an F1-score of 0.990538 in Arabic token classification tasks. In addition, the chatbot implementation evaluation on 15 Arabic sentences obtained a token classification accuracy of 92.54%, with 62 correctly classified tokens out of 67 tested tokens. Classification errors generally occurred in clitic tokens and short particles such as conjunctions and prefixes attached to root words. Overall, the system is able to support basic Arabic language learning and provide automatic and interactive Arabic word classification analysis.
ARABIC:
يهدف هذا البحث إلى تطوير روبوت محادثة لتعلّم اللغة العربية قائم على معالجة اللغة الطبيعية باستخدام أسلوب الضبط الدقيق لنموذج AraBERT لتصنيف أنواع الكلمات العربية إلى اسم وفعل وحرف. تم تطوير النظام باستخدام مجموعة بيانات MASAQ الخاصة بالتحليل الصرفي والنحوي للغة العربية، ثم تم دمجه في روبوت محادثة تفاعلي قائم على الويب. أظهرت نتائج التطبيق أن روبوت المحادثة قادر على تحليل أنواع الكلمات العربية تلقائيًا في جمل اللغة العربية الفصحى الحديثة (MSA) بشكل متسق إلى حدٍّ كبير. كما حقق النموذج قيمة F1-score بلغت 0.990538 في مهمة تصنيف الكلمات العربية. بالإضافة إلى ذلك، أظهرت نتائج تقييم تطبيق روبوت المحادثة على 15 جملة عربية نسبة دقة بلغت 92.54٪، حيث تم تصنيف 62 كلمة بشكل صحيح من أصل 67 كلمة تم اختبارها. وظهرت أخطاء التصنيف غالبًا في الكلمات القصيرة واللواصق النحوية مثل حروف العطف والبادئات المتصلة بالكلمات الأساسية. وبشكل عام، يستطيع النظام دعم تعلّم اللغة العربية الأساسية وتقديم تحليل تلقائي وتفاعلي لتصنيف الكلمات العربية.
| Item Type: | Thesis (Undergraduate) |
|---|---|
| Supervisor: | Faisal, Muhammad and Kurniawan, Fachrul |
| Keywords: | Chatbot; Bahasa Arab; Natural Language Processing; Fine-Tuning; AraBERT; Arabic Language; Token Classification; روبوت المحادثة ; اللغة العربية ; معالجة اللغة الطبيعية ; الضبط الدقيق تصنيف الكلمات |
| Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing |
| Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
| Depositing User: | Al Humayroh |
| Date Deposited: | 03 Jun 2026 13:24 |
| Last Modified: | 03 Jun 2026 13:24 |
| URI: | http://etheses.uin-malang.ac.id/id/eprint/84937 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |
