Yuliana, Rossima Eva (2026) Implementasi metode clustering HDBSCAN dalam segmentasi konsumen e-commerce berdasarkan perilaku belanja. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
220601110068.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (4MB) |
Abstract
INDONESIA:
Clustering merupakan salah satu teknik data mining yang digunakan untuk mengelompokkan data berdasarkan tingkat kemiripan karakteristik yang dimiliki. Pada e-commerce, clustering dapat digunakan untuk melakukan segmentasi konsumen berdasarkan perilaku belanja sehingga membantu perusahaan dalam memahami karakteristik konsumen. Salah satu metode clustering yang dapat digunakan adalah Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN) karena mampu mengelompokkan data dengan tingkat kepadatan yang berbeda serta mengidentifikasi data yang tidak termasuk ke dalam klaster sebagai noise. Penelitian ini bertujuan untuk mengimplementasikan metode HDBSCAN dalam segmentasi konsumen e-commerce berdasarkan perilaku belanja. Data yang digunakan merupakan data sekunder dari dataset E-commerce Customer Behavior and Sales Analysis-TR yang diperoleh dari Kaggle dengan jumlah 5.000 data transaksi konsumen e-commerce di Turki pada periode Januari 2023 hingga Maret 2024. Tahapan penelitian meliputi normalisasi data menggunakan Min-Max Scaler, perhitungan jarak Euclidean, penerapan algoritma HDBSCAN, serta evaluasi hasil klaster menggunakan Silhouette Coefficient dan Davies Bouldin Index. Hasil penelitian menunjukkan bahwa parameter terbaik diperoleh pada nilai min_samples 55 dan min_cluster_size 55 yang menghasilkan 6 klaster. Nilai Silhouette Coefficient yang diperoleh sebesar 0,2155 dan Davies Bouldin Index sebesar 1,6047. Berdasarkan karakteristik masing-masing klaster, konsumen dapat dikelompokkan menjadi Pelanggan Terbaik, Pelanggan Berisiko, Pelanggan Potensial, Pelanggan Loyal, Pelanggan Sensitif Promosi, dan Pelanggan Hampir Hilang. Dengan demikian, metode HDBSCAN mampu melakukan segmentasi konsumen e-commerce berdasarkan kemiripan perilaku belanja serta mengidentifikasi data yang tidak tergabung dalam klaster sebagai noise.
ENGLISH:
Clustering is a data mining technique used to group data based on the degree of similarity in their characteristics. In e-commerce, clustering can be used to segment consumers based on shopping behavior, thereby helping companies understand consumer characteristics. One clustering method that can be used is Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN) because it is capable of grouping data with different density levels and identifying data that does not belong to a cluster as noise. This study aims to implement the HDBSCAN method in e-commerce consumer segmentation based on shopping behavior. The data used is secondary data from the E-commerce Customer Behavior and Sales Analysis-TR dataset obtained from Kaggle, consisting of 5.000 e-commerce consumer transaction records in Turkey from January 2023 to March 2024. The research stages include data normalization using the Min-Max Scaler, calculation of Euclidean distance, application of the HDBSCAN algorithm, and evaluation of clustering results using the Silhouette Coefficient and Davies-Bouldin Index. The results show that the optimal parameters were obtained at min_samples = 55 and min_cluster_size = 55, yielding six clusters. The Silhouette Coefficient value obtained was 0,2155, and the Davies-Bouldin Index was 1,6047. Based on the characteristics of each cluster, consumers can be grouped into Top Customers, At-Risk Customers, Potential Customers, Loyal Customers, Promotion-Sensitive Customers, and Churn-Prone Customers. Thus, the HDBSCAN method is capable of segmenting e-commerce consumers based on similarities in shopping behavior and identifying data that does not belong to any cluster as noise.
ARABIC:
التجميع هو إحدى تقنيات استخراج البيانات التي تُستخدم لتصنيف البيانات بناءً على درجة تشابه خصائصها. في التجارة الإلكترونية، يمكن استخدام التجميع لإجراء تقسيم المستهلكين بناءً على سلوك التسوق، مما يساعد الشركات في فهم خصائص المستهلكين. إحدى طرق التجميع التي يمكن استخدامها هي التجميع المكاني الهرمي القائم على الكثافة للتطبيقات مع الضوضاء (HDBSCAN) لأنها هدقت على تجميع البيانات بمستويات كثافة مختلفة وكذلك تحديد البيانات التي لا تندرج ضمن المجموعات على أنها ضوضاء. هدقت هذه الدراسة إلى تطبيق طريقة HDBSCAN في تقسيم المستهلكين في التجارة الإلكترونية بناءً على سلوكهم الشرائي. البيانات المستخدمة هي بيانات ثانوية من مجموعة بيانات
E-commerce Customer Behavior and Sales Analysis-TRالتي تم الحصول عليها
من Kaggle ، وتضم ٥.٠٠٠ معاملة للمستهلكين في التجارة الإلكترونية في تركيا خلال الفترة من يناير ٢٠٢٣ إلى مارس ٢٠٢٤. تشمل مراحل البحث تطبيع البيانات باستخدام Min-Max Scaler ، وحساب المسافة الأوقليدية، وتطبيق خوارزمية HDBSCAN ، وتقييم نتائج المجموعات باستخدام معامل Silhouette Coefficient ومؤشر Davies Bouldin Index. أظهرت نتائج البحث أن أفضل المعلمات تم الحصول عليها عند قيمة ٥٥ min_samples و ٥٥ min_cluster_size ، مما أدى إلى تكوين ٦ مجموعات. بلغت قيمة معامل ٠.٢١٥٥
Silhouette Coefficient ومؤشر ١.٦٠٤٧. Davies Bouldin Index وبناءً على خصائص كل مجموعة، يمكن تصنيف المستهلكين إلى أفضل العملاء، والعملاء المعرضين للمخاطر، والعملاء المحتملين، والعملاء المخلصين، والعملاء الحساسين للعروض الترويجية، والعملاء الذين على وشك الانسحاب. وبالتالي، فإن طريقة HDBSCAN قادرة على إجراء تقسيم المستهلكين في التجارة الإلكترونية بناءً على تشابه سلوك الشراء، وكذلك تحديد البيانات غير المضمنة في المجموعات على أنها ضوضاء.
| Item Type: | Thesis (Undergraduate) |
|---|---|
| Supervisor: | Fahmi, Hisyam and Jauhari, Mohammad Nafie |
| Keywords: | Clustering; E-commerce; HDBSCAN; Perilaku Belanja; Segmentasi Konsumen; Shopping Behaviour; Consumer Segmentation; التجميع; التجارة الإلكترونية; سلوك التسوق; تقسيم المستهلكين |
| Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining |
| Departement: | Fakultas Sains dan Teknologi > Jurusan Matematika |
| Depositing User: | Rossima Eva Yuliana |
| Date Deposited: | 22 Jun 2026 10:31 |
| Last Modified: | 22 Jun 2026 10:31 |
| URI: | http://etheses.uin-malang.ac.id/id/eprint/85754 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |
