Putri, Nova Rahma Yunida (2025) Prediksi pendapatan box office film menggunakan Random Forest berdasarkan anggaran, pemain, dan jumlah penayangan trailer. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
210605110014.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) |
Abstract
INDONESIA:
Industri film saat ini menjadi salah satu bentuk hiburan yang terus berkembang dan memiliki pengaruh besar terhadap masyarakat. Kesuksesan sebuah film tidak hanya ditentukan oleh kualitas ceritanya, tetapi juga dipengaruhi oleh pendapatan yang diperoleh di box office. Beberapa faktor seperti anggaran produksi, ketenaran pemain, dan jumlah penayangan trailer di platform digital dianggap berkontribusi terhadap pendapatan tersebut. Penelitian ini bertujuan untuk memprediksi pendapatan box office film berdasarkan tiga fitur, yaitu anggaran, ketenaran pemain, dan jumlah tayangan trailer dengan menggunakan algoritma Random Forest. Pengujian dilakukan dengan tiga skenario pembagian data, yaitu rasio 9:1, 8:2, dan 7:3, serta validasi model menggunakan K-Fold Cross Validation dengan dua skenario, 5-Fold dan 10-Fold. Hasil pengujian menunjukkan bahwa skenario rasio 9:1 menghasilkan performa terbaik dengan nilai MAE sebesar 0.36, MSE 0.32, dan R^2 sebesar 0.6934. Sementara itu, validasi model menggunakan 5-Fold menghasilkan rata-rata nilai R^2 sebesar 0.6571, sedangkan 10-Fold sebesar 0.6468 dengan nilai MAE dan MSE yang sama, yaitu 0.41 dan 0.34. Hasil penelitian ini menunjukkan bahwa model Random Forest mampu memprediksi pendapatan box office dengan cukup baik, meskipun terdapat fluktuasi performa berdasarkan pembagian data dan metode validasi yang digunakan.
ENGLISH:
The film industry has become one of the fastest-growing forms of entertainment, exerting a significant influence on society. A film's success is not solely determined by the quality of its storyline, but also by the revenue it generates at the box office. Several factors, such as production budget, actor popularity, and the number of trailer views on digital platforms, are considered to contribute to that revenue. This study aims to predict box office revenue based on three features: budget, actor popularity, and trailer view count, using the Random Forest algorithm. The testing process was carried out using three data splitting scenarios with ratios of 9:1, 8:2, and 7:3, along with model validation using K-Fold Cross Validation with two scenarios: 5-Fold and 10-Fold. The results show that the 9:1 ratio scenario achieved the best performance with an MAE of 0.36, MSE of 0.32, and R score of 0.6934. Meanwhile, model validation using a 5-Fold cross-validation yielded an average R score of 0.6571, while a 10-Fold cross-validation resulted in 0.6468, with the same MAE and MSE values of 0.41 and 0.34, respectively. These findings suggest that the Random Forest model can predict box office revenue with reasonable accuracy, although its performance may vary depending on the data split and validation method employed.
ARABIC:
تعد صناعة السينما حاليًا أحد أشكال الترفيه التي تستمر في النمو ولها تأثير كبير على المجتمع. لا يتحدد نجاح الفيلم بجودة القصة فحسب، بل يتأثر أيضاً بالإيرادات التي يحققها في شباك التذاكر. وتساهم عدة عوامل مثل ميزانية الإنتاج وشهرة الممثلين وعدد مشاهدات الإعلانات الدعائية على المنصات الرقمية في تحقيق الإيرادات. تهدف هذه الدراسة إلى التنبؤ بإيرادات شباك تذاكر الأفلام بناءً على ثلاث سمات، وهي الميزانية وشهرة الممثلين وعدد مشاهدات الإعلانات الدعائية باستخدام خوارزمية الغابة العشوائية. وقد أُجريت الاختبارات باستخدام ثلاثة سيناريوهات لمشاركة البيانات، وهي نسب 9:1 و8:2 و7:3، والتحقق من صحة النموذج باستخدام التحقق المتقاطع K-Fold Cross Validation مع سيناريوهين هما 5 أضعاف و10 أضعاف. تُظهر نتائج الاختبار أن سيناريو نسبة 9:1 يُنتج أفضل أداء مع قيمة MAE تبلغ 0.36، و MSE 0.32، و R 0.6934. وفي الوقت نفسه، ينتج عن التحقق من صحة النموذج باستخدام 5 أضعاف متوسط قيمة R تبلغ 0.6571، بينما تبلغ قيمة R 10 أضعاف 0.6468 بنفس قيم المتوسط المتوسطي المتكرر و MSE، وهي 0.41 و 0.34. تُظهر نتائج هذه الدراسة أن نموذج الغابة العشوائية قادر على التنبؤ بإيرادات شباك التذاكر بشكل جيد، على الرغم من وجود اختلافات في الأداء بناءً على تقسيم البيانات وطريقة التحقق من الصحة المستخدمة.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Suhartono, Suhartono and Aziz, Okta Qomaruddin |
Keywords: | Pendapatan Box Office; Model Prediksi; Random Forest; Box Office Revenue; Prediction Model; Random Forest; عائدات شباك التذاكر ;نموذج التنبؤ ;الغابة العشوائية |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Nova Rahma Yunida Putri |
Date Deposited: | 10 Jun 2025 08:19 |
Last Modified: | 10 Jun 2025 08:19 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/75400 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |