Responsive Banner

Prediksi dan analisis faktor penentu Customer Lifetime Value (CLV) pada E-Commerce menggunakan Random Forest Regression

Palupi, Annisa Adenanty (2025) Prediksi dan analisis faktor penentu Customer Lifetime Value (CLV) pada E-Commerce menggunakan Random Forest Regression. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

This is the latest version of this item.

[img] Text (Fulltext)
220605110166.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(2MB)

Abstract

ABSTRAK

Customer Lifetime Value (CLV) merupakan indikator penting dalam menilai profitabilitas jangka panjang pelanggan pada platform e-commerce. Penelitian ini bertujuan untuk memprediksi nilai CLV serta menganalisis faktor-faktor yang berperan penting dalam pembentukannya menggunakan algoritma Random Forest Regression. Dataset yang digunakan terdiri dari empat fitur perilaku transaksi, yaitu Total_Sales, Frequency, Recency, dan Total_Quantity. Model dievaluasi menggunakan metrik MAE, MSE, MAPE, dan R² untuk menilai tingkat akurasi prediksi. Hasil penelitian menunjukkan bahwa model Random Forest Regression mampu memberikan performa prediksi yang sangat baik, dengan capaian terbaik pada Skenario Baseline yang memperoleh nilai R² sebesar 0.94, MAE sebesar 0.04, dan MAPE sebesar 17.96%. Analisis feature importance mengidentifikasi bahwa Frequency merupakan faktor yang paling dominan dalam memengaruhi nilai CLV, diikuti oleh Total_Sales dan Total_Quantity, sedangkan Recency memiliki pengaruh paling rendah. Temuan ini menunjukkan bahwa intensitas dan nilai transaksi pelanggan merupakan aspek utama dalam menentukan besar kecilnya CLV pada platform e-commerce. Penelitian ini memberikan kontribusi dalam penyediaan model prediksi CLV yang akurat dan dapat digunakan sebagai dasar pengambilan keputusan strategis berbasis data.

ABSTRACT

Customer Lifetime Value (CLV) is an important indicator in assessing the long-term profitability of customers on e-commerce platforms. This study aims to predict CLV values and analyze the factors that play a significant role in their formation using the Random Forest Regression algorithm. The dataset used consists of four transaction behavior features, namely Total_Sales, Frequency, Recency, and Total_Quantity. The model was evaluated using MAE, MSE, MAPE, and R² metrics to assess the accuracy of the predictions. The results show that the Random Forest Regression model is capable of providing excellent prediction performance, with the best results in the Baseline Scenario, which obtained an R² value of 0.94, MAE of 0.04, and MAPE of 17.96%. Feature importance analysis identified Frequency as the most dominant factor influencing CLV, followed by Total_Sales and Total_Quantity, while Recency had the least influence. These findings indicate that customer transaction intensity and value are the main aspects in determining the magnitude of CLV on e-commerce platforms. This research contributes to the provision of an accurate CLV prediction model that can be used as a basis for data-driven strategic decision making.

البحث مستخلص

تعد قيمة العمر الافتراضي للعميل مؤشراً مهماً في تقييم الربحية طويلة الأجل للعملاء على منصات التجارة الإلكترونية. تهدف هذه الدراسة إلى توقع قيم CLV وتحليل العوامل التي تلعب دوراً مهماً في تكوينها باستخدام خوارزمية Random Forest Regression. تتكون مجموعة البيانات المستخدمة من أربع سمات لسلوك المعاملات، وهي مبلغ المبيعات والتكرار والحداثة والكمية الإجمالية. تم تقييم النموذج باستخدام مقاييس MAE و MSE و MAPE و R² لتقييم دقة التنبؤات. أظهرت النتائج أن نموذج Random Forest Regression قادر على توفير أداء تنبؤي ممتاز، مع أفضل النتائج في السيناريو الأساسي، الذي حصل على قيمة R² تبلغ 0.94 و MAE تبلغ 0.04 و MAPE تبلغ 17.96٪. حدد تحليل أهمية الميزات التكرار كأكثر العوامل تأثيرًا على CLV، يليه إجمالي المبيعات وإجمالي الكمية، بينما كان للحداثة أقل تأثير. تشير هذه النتائج إلى أن كثافة معاملات العملاء وقيمتها هما الجانبان الرئيسيان في تحديد حجم CLV على منصات التجارة الإلكترونية. تساهم هذه الدراسة في توفير نموذج تنبؤ دقيق لقيمة العميل مدى الحياة يمكن استخدامه كأساس لاتخاذ قرارات استراتيجية قائمة على البيانات.

Item Type: Thesis (Undergraduate)
Supervisor: Suhartono, Suhartono and Kurniawan, Fachrul
Keywords: Customer Lifetime Value; Random Forest Regression; Prediksi; Feature Importance; E-Commerce. Customer Lifetime Value; Random Forest Regression; Prediction; Feature Importance; E-Commerce. قيمة العميل مدى الحياة; انحدار الغابة العشوائية; التنبؤ أهمية الميزة;التجارة الإلكترونية.
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining
08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080110 Simulation and Modelling
08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080199 Artificial Intelligence and Image Processing not elsewhere classified
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Annisa Adenanty Palupi
Date Deposited: 12 Jan 2026 08:21
Last Modified: 12 Jan 2026 08:21
URI: http://etheses.uin-malang.ac.id/id/eprint/83229

Downloads

Downloads per month over past year

Available Versions of this Item

Actions (login required)

View Item View Item