Palupi, Annisa Adenanty (2025) Prediksi dan analisis faktor penentu Customer Lifetime Value (CLV) pada E-Commerce menggunakan Random Forest Regression. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
This is the latest version of this item.
|
Text (Fulltext)
220605110166.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. (2MB) |
Abstract
ABSTRAK
Customer Lifetime Value (CLV) merupakan indikator penting dalam menilai profitabilitas jangka panjang pelanggan pada platform e-commerce. Penelitian ini bertujuan untuk memprediksi nilai CLV serta menganalisis faktor-faktor yang berperan penting dalam pembentukannya menggunakan algoritma Random Forest Regression. Dataset yang digunakan terdiri dari empat fitur perilaku transaksi, yaitu Total_Sales, Frequency, Recency, dan Total_Quantity. Model dievaluasi menggunakan metrik MAE, MSE, MAPE, dan R² untuk menilai tingkat akurasi prediksi. Hasil penelitian menunjukkan bahwa model Random Forest Regression mampu memberikan performa prediksi yang sangat baik, dengan capaian terbaik pada Skenario Baseline yang memperoleh nilai R² sebesar 0.94, MAE sebesar 0.04, dan MAPE sebesar 17.96%. Analisis feature importance mengidentifikasi bahwa Frequency merupakan faktor yang paling dominan dalam memengaruhi nilai CLV, diikuti oleh Total_Sales dan Total_Quantity, sedangkan Recency memiliki pengaruh paling rendah. Temuan ini menunjukkan bahwa intensitas dan nilai transaksi pelanggan merupakan aspek utama dalam menentukan besar kecilnya CLV pada platform e-commerce. Penelitian ini memberikan kontribusi dalam penyediaan model prediksi CLV yang akurat dan dapat digunakan sebagai dasar pengambilan keputusan strategis berbasis data.
ABSTRACT
Customer Lifetime Value (CLV) is an important indicator in assessing the long-term profitability of customers on e-commerce platforms. This study aims to predict CLV values and analyze the factors that play a significant role in their formation using the Random Forest Regression algorithm. The dataset used consists of four transaction behavior features, namely Total_Sales, Frequency, Recency, and Total_Quantity. The model was evaluated using MAE, MSE, MAPE, and R² metrics to assess the accuracy of the predictions. The results show that the Random Forest Regression model is capable of providing excellent prediction performance, with the best results in the Baseline Scenario, which obtained an R² value of 0.94, MAE of 0.04, and MAPE of 17.96%. Feature importance analysis identified Frequency as the most dominant factor influencing CLV, followed by Total_Sales and Total_Quantity, while Recency had the least influence. These findings indicate that customer transaction intensity and value are the main aspects in determining the magnitude of CLV on e-commerce platforms. This research contributes to the provision of an accurate CLV prediction model that can be used as a basis for data-driven strategic decision making.
البحث مستخلص
تعد قيمة العمر الافتراضي للعميل مؤشراً مهماً في تقييم الربحية طويلة الأجل للعملاء على منصات التجارة الإلكترونية. تهدف هذه الدراسة إلى توقع قيم CLV وتحليل العوامل التي تلعب دوراً مهماً في تكوينها باستخدام خوارزمية Random Forest Regression. تتكون مجموعة البيانات المستخدمة من أربع سمات لسلوك المعاملات، وهي مبلغ المبيعات والتكرار والحداثة والكمية الإجمالية. تم تقييم النموذج باستخدام مقاييس MAE و MSE و MAPE و R² لتقييم دقة التنبؤات. أظهرت النتائج أن نموذج Random Forest Regression قادر على توفير أداء تنبؤي ممتاز، مع أفضل النتائج في السيناريو الأساسي، الذي حصل على قيمة R² تبلغ 0.94 و MAE تبلغ 0.04 و MAPE تبلغ 17.96٪. حدد تحليل أهمية الميزات التكرار كأكثر العوامل تأثيرًا على CLV، يليه إجمالي المبيعات وإجمالي الكمية، بينما كان للحداثة أقل تأثير. تشير هذه النتائج إلى أن كثافة معاملات العملاء وقيمتها هما الجانبان الرئيسيان في تحديد حجم CLV على منصات التجارة الإلكترونية. تساهم هذه الدراسة في توفير نموذج تنبؤ دقيق لقيمة العميل مدى الحياة يمكن استخدامه كأساس لاتخاذ قرارات استراتيجية قائمة على البيانات.
Downloads
Downloads per month over past year
Available Versions of this Item
-
PREDIKSI DAN ANALISIS FAKTOR PENENTU CUSTOMER LIFETIME VALUE (CLV) PADA E-COMMERCE MENGGUNAKAN
RANDOM FOREST REGRESSION. (deposited UNSPECIFIED)
- Prediksi dan analisis faktor penentu Customer Lifetime Value (CLV) pada E-Commerce menggunakan Random Forest Regression. (deposited 12 Jan 2026 08:21) [Currently Displayed]
Actions (login required)
![]() |
View Item |
