Responsive Banner

Pengelompokan aksara Jawa dalam citra digital dengan metode Agglomerative Hierarchical Clustering

Diano, Senator Marcielio Cheviray (2025) Pengelompokan aksara Jawa dalam citra digital dengan metode Agglomerative Hierarchical Clustering. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
210605110053.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(6MB)

Abstract

INDONESIA:

Penelitian ini membahas permasalahan kualitas hasil pengelompokan (clustering) aksara Jawa pada citra digital yang memiliki variasi bentuk tinggi serta kualitas visual yang tidak seragam akibat faktor usia dokumen historis. Permasalahan utama dalam penelitian ini adalah bagaimana kualitas hasil clustering aksara Jawa menggunakan metode Agglomerative Hierarchical Clustering (AHC) dengan ekstraksi fitur Histogram of Oriented Gradients (HOG), yang dievaluasi menggunakan metrik Silhouette Score dan Davies Bouldin Index (DBI). Sebagai solusi, penelitian ini mengusulkan penerapan tahapan preprocessing citra yang meliputi Gaussian Blur, Bilateral Filter, dan Adaptive Thresholding untuk meningkatkan kualitas visual citra sebelum dilakukan segmentasi. Data penelitian berupa citra aksara Jawa hasil digitalisasi Majalah Kejawen volume 6 dan 21 tahun 1927. Setelah proses segmentasi, setiap citra aksara tunggal diekstraksi cirinya menggunakan HOG dan selanjutnya dikelompokkan menggunakan metode AHC dengan variasi nilai distance threshold sebagai skenario uji coba. Evaluasi kualitas clustering dilakukan menggunakan Silhouette Score dan Davies–Bouldin Index untuk menilai tingkat pemisahan antar cluster dan kekompakan internal cluster. Hasil pengujian menunjukkan bahwa distance threshold 12 memberikan konfigurasi terbaik dengan nilai Silhouette Score sebesar 0,0837 dan Davies Bouldin Index sebesar 2,7621, serta menghasilkan 159 cluster yang relatif stabil dan representatif terhadap variasi bentuk aksara Jawa. Meskipun nilai evaluasi secara keseluruhan masih tergolong rendah akibat pengaruh kualitas citra historis seperti aksara terputus dan ketidakseragaman tinta, penelitian ini menyimpulkan bahwa metode Agglomerative Hierarchical Clustering dengan fitur HOG mampu melakukan pengelompokan aksara Jawa secara cukup baik.

ENGLISH:

This study addresses the problem of clustering quality in Javanese script digital images, which exhibit high shape variability and inconsistent visual quality due to the age-related degradation of historical documents. The main problem investigated in this research is how well Javanese script images can be clustered using the Agglomerative Hierarchical Clustering (AHC) method with Histogram of Oriented Gradients (HOG) feature extraction, evaluated using the Silhouette Score and Davies Bouldin Index (DBI) metrics. As a solution, this study proposes the application of image preprocessing stages, including Gaussian Blur, Bilateral Filter, and Adaptive Thresholding, to enhance visual image quality prior to segmentation. The dataset consists of digital images of Javanese script obtained from the digitization of Majalah Kejawen volumes 6 and 21 published in 1927. After segmentation, each single -character image is processed using HOG feature extraction and subsequently clustered using the AHC method with various distance threshold values as experimental scenarios. Clustering performance is evaluated using the Silhouette Score and Davies Bouldin Index to assess inter-cluster separation and intra-cluster compactness. Experimental results show that a distance threshold of 12 yields the best configuration, achieving a Silhouette Score of 0.0837 and a Davies Bouldin Index of 2.7621, resulting in 159 clusters that are relatively stable and representative of the variations in Javanese script shapes. Although the overall evaluation scores remain relatively low due to limitations inherent in historical image quality such as broken characters and inconsistent ink thickness. This study concludes that Agglomerative Hierarchical Clustering combined with HOG features is capable of performing Javanese script clustering with reasonably good performance.

ARABIC:

يناقش هذا البحث مشكلة جودة نتائج تجميع (Clustering) الأحرف الجاوية في الصور الرقمية التي تتميز بتباين عالٍ في الأشكال وجودة بصرية غير موحدة نتيجة لعامل عمر الوثائق التاريخية. تتمثل المشكلة الرئيسية في هذا البحث في تحديد جودة نتائج تجميع الأحرف الجاوية باستخدام طريقة التجميع الهرمي التكتلي (AHC) مع استخراج الميزات باستخدام مدرج التدرجات الموجهة (HOG)، والتي يتم تقييمها باستخدام مقياس "Silhouette Score" ومؤشر "Davies Bouldin Index" (DBI). وكحل مقترح، يقدم هذا البحث تطبيق مراحل المعالجة المسبقة للصور (Preprocessing) التي تشمل "Gaussian Blur" و"Bilateral Filter" و"Adaptive Thresholding" لتحسين الجودة البصرية للصورة قبل إجراء عملية التقطيع (Segmentation). تتكون بيانات البحث من صور للأحرف الجاوية الناتجة عن رقمنة مجلة "Kejawen" المجلدين ٦ و ٢١ لعام ١٩٢٧. بعد عملية التقطيع، يتم استخراج خصائص كل صورة حرف منفردة باستخدام تقنية HOG، ومن ثم تجميعها باستخدام طريقة AHC مع تنويع قيم عتبة المسافة (distance threshold) كسيناريوهات تجريبية. تم إجراء تقييم جودة التجميع باستخدام "Silhouette Score" و"Davies Bouldin Index" لقياس مستوى الفصل بين المجموعات والتماسك الداخلي للمجموعة. أظهرت نتائج الاختبار أن عتبة المسافة بقيمة ١٢ تعطي أفضل تكوين، حيث بلغت قيمة "Silhouette Score" ٠,٠٨٣٧ وقيمة "Davies Bouldin Index" ٢,٧٦٢١، كما أنتجت ١٥٩ مجموعة (cluster) مستقرة نسبياً وممثلة لتباين أشكال الأحرف الجاوية. على الرغم من أن قيم التقييم الإجمالية لا تزال منخفضة نسبياً بسبب تأثير جودة الصور التاريخية مثل الأحرف المقطوعة وعدم انتظام الحبر، إلا أن هذا البحث يخلص إلى أن طريقة التجميع الهرمي التكتلي (AHC) مع ميزات HOG قادرة على تجميع الأحرف الجاوية بشكل جيد.

Item Type: Thesis (Undergraduate)
Supervisor: Syauqi, A'la and Priandani, Nurizal Dwi
Keywords: Aksara Jawa; Pengelompokan; Agglomerative Hierarchical Clustering; Histogram of Oriented Gradients; Javanese Script; Clustering; الأحرف الجاوية; التجميع; التجميع الهرمي التكتلي (AHC); مدرج التدرجات الموجهة (HOG)
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080104 Computer Vision
08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080106 Image Processing
08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080199 Artificial Intelligence and Image Processing not elsewhere classified
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Senator Marcielio Cheviray Diano
Date Deposited: 10 Feb 2026 09:29
Last Modified: 10 Feb 2026 09:29
URI: http://etheses.uin-malang.ac.id/id/eprint/82550

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item