Saputra, Muhammad Andryan Wahyu (2023) Optimasi hasil evaluasi Clustering melalui kombinasi Algoritma Dynamic k-Means dan k-Means Binary Search Centroid. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
210605210010.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (3MB) | Preview |
Abstract
ABSTRAK
Penelitian ini difokuskan untuk menentukan derajat kesehatan setiap kabupaten/kota dalam Pulau Jawa menggunakan algoritma K-means Binary Search Centroid (KBSC) dan Dynamic K-means (DK). Data penelitian menggunakan data profil kesehatan Pulau Jawa tahun 2020. Perbandingan algoritma terbaik diuji tingkat validitasnya menggunakan metode Elbow, Davies Bound Index (DBI) dan Calinski-Harabasz Index (CHI) pada algoritma K-means tradisional dan K-means Dynamic Binary Search Centroid. Berdasarkan pengujian diperoleh 5 jumlah cluster di wilayah sebaran, di antaranya cluster 1 dengan kualitas kesehatan sangat tinggi adalah 11 kabupaten/kota, cluster 2 dengan kualitas kesehatan sangat rendah adalah 24 kabupaten/kota, dan cluster 3 dengan kualitas kesehatan rendah adalah 28 kabupaten/kota. dan kualitas kesehatan 45 kabupaten/kota untuk cluster 4 dengan kualitas kesehatan cukup serta cluster 5 dengan kualitas kesehatan tinggi adalah 11 kabupaten/kota. Secara keseluruhan optimasi algoritma K-means Dynamic Binary Search Centroid menghasilkan rata-rata kualitas cluster yang lebih baik dibanding algoritma K-means tradisional. Hal ini ditunjukkan dengan evaluasi metode Elbow menghasilkan jumlah cluster terbaik sebanyak 5, perbedaan nilai DBI sebesar 0.6825546 dimana metode yang diusulkan memiliki nilai lebih baik dibanding metode K-means tradisional. Serta jumlah dan variasi data mempengaruhi kinerja algoritma dan besar nilai evaluasi algoritma. Hasil pengujian dapat digunakan sebagai salah satu metode terbaik dalam evaluasi tingkat kesehatan yang ada di wilayah khususnya Pulau Jawa serta acuan pengambilan keputusan dalam menentukan kebijakan bagi instansi terkait.
ABSTRACT
This research is focused on determining the health status of each district/city in Java using the K-means Binary Search Centroid (KBSC) and Dynamic K-means (DK) algorithms. The research data used health profile data for the island of Java in 2020. Comparison of the best algorithms was tested for validity using the Elbow, Davies Bound Index (DBI) and Calinski-Harabasz Index (CHI) methods on the traditional K-means algorithm and the K-means Dynamic Binary Search Centroid. Based on the test, it obtained 5 clusters in the distribution area, including cluster 1 with very high health quality were 11 districts/cities, cluster 2 with very low health quality were 24 districts/cities, and cluster 3 with low health quality were 28 districts/cities . and the health quality of 45 districts/cities for cluster 4 with adequate health quality and for cluster 5 with high health quality are 11 districts/cities. Overall the optimization of the K-means Dynamic Binary Search Centroid algorithm produces a better average cluster quality than the traditional K-means algorithm. This is shown by the evaluation of the Elbow method which produces the best number of clusters of 5, the difference in the DBI value is 0.6825546 where the proposed method has a better value than the traditional K-means method. As well as the amount and variety of data affect the performance of the algorithm and the value of the algorithm evaluation. The test results can be used as one of the best methods in evaluating the level of health in the region, especially Java Island, as well as a reference for decision making in determining policies for related agencies.
مستخلص البحث
ركزت هذا البحث على تحديد الدرجة الصحية لكل منطقة / مدينة في جزيرة جاوى باستخدام خوارزمية تصنيفية وسائل ك للبحث الثنائي التمركزية و وسائل ك الديناميكية. استخدمت بيانات البحث بيانات الملف الصحي لجزيرة جاوى في عام ٢٠٢٠. تم اختبار أفضل مقارنات الخوارزميات للتأكد من صحتها باستخدام طرق Elbow و Davies Bound Index (DBI) و Calinski-Harabasz Index (CHI) على خوارزمية تصنيفية وسائل ك التقليدية ووسائل ك للبحث الثنائي التمركزية. واستنادا إلى الاختبارات، تم الحصول على ٥ مجموعات في منطقة التوزيع، بما في ذلك المجموعة الأولى ذات الجودة الصحية العالية جدا وهي ١١ منطقة/مدينة، والمجموعة الثانية ذات الجودة الصحية المنخفضة جدا هي ٢٤ منطقة/مدينة، والمجموعة الثالثة ذات الجودة الصحية المنخفضة هي ٢٨ منطقة/مدينة. والجودة الصحية ل ٤٥ منطقة / مدينة للمجموعة الرابعة ذات جودة صحية كافية والمجموعة الخامسة ذات الجودة الصحية العالية هي ١١ منطقة / مدينة. بشكل عام، يؤدي ترقية خوارزمية وسائل ك للبحث الثنائي التمركزية إلى متوسط جودة الكتلة أفضل من خوارزمية وسائل ك التقليدية. يظهر ذلك من خلال تقييم طريقة Elbow مما أدى إلى أفضل عدد من المجموعات بقدر ٥، وفرق في قيمة DBI قدره ٠.٦٨٢٥٥٤٦، حيث يكون للطريقة المقترحة قيمة أفضل من طريقة وسائل ك التقليدية. وكذلك يؤثر مقدار البيانات وتنوعها على أداء الخوارزمية وحجم قيمة تقييم الخوارزمية. يمكن استخدام نتائج الاختبار كواحدة من أفضل الطرق في تقييم مستوى الصحة في المنطقة، وخاصة جاوى. وكذلك كمرجع لاتخاذ القرار في تحديد السياسات للوكالات ذات الصلة.
Downloads
Downloads per month over past year
Actions (login required)
View Item |