Elmuna, Emha Ahdan Fahmi (2023) Optimasi metode random forest menggunakan Principal Component Analysis untuk memprediksi harga rumah. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
210605220005.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) | Preview |
Abstract
ABSTRAK
Investasi menjadi hal yang menarik, khususnya investasi di bidang properti. Pihak developer juga harus berhati hati dalam menentukan harga properti. Perlu diketahui setiap tahunnya baik jangka pendek ataupun jangka panjang harga properti semakin naik dan bahkan hampir tidak pernah turun. Dalam menentukan harga sering juga berdasarkan dengan fitur yang dimiliki rumah seperti konsep, lokasi, kamar tidur, dll. Untuk memprediksi harga rumah berdasarkan fiturnya random forest mempunyai performa yang bagus untuk prediksi harga rumah. Namun metode random forest memiliki kelemahan jika penggunaan variabel terlalu banyak maka proses pelatihan menjadi lebih lama serta pemilihan fitur yang cenderung memilih fitur yang tidak informatif. Salah satu cara yang digunakan untuk mengurangi fitur tanpa harus menghapus fitur yang lain yaitu menggunakan Principal Component Analysis. Dalam penelitian ini motede yang digunakan adalah Principal Component Analysis dan random forest. Hasil pelatihan model dapat disimpulkan bahwa penggunaan hasil evaluasi model yang menggunakan PCA memiliki tingkat error yang lebih kecil dan nilainya lebih konsisten yaitu dengan rata-rata 0.0253. Sedangkan hasil evaluasi tanpa PCA dan hanya menggunakan random forest memiliki nilai eror yang lebih besar yaitu dengan rata rata 0.03275. Waktu pelatihan dengan menggunakan model PCA memiliki waktu yang lebih cepat dengan rata-rata 5007 milidetik, sedangkan yang hanya menggunakan random forest tanpa PCA memiliki waktu rata-rata 6099 milidetik.
مستخلص البحث
الاستثمار شيء مثير للاهتمام ، وخاصة الاستثمار في العقارات. يجب على المطور أيضًا توخي الحذر في تحديد سعر العقار. وتجدر الإشارة إلى أنه في كل عام ، على المدى القصير والطويل ، تتزايد أسعار العقارات ولا تنخفض أبدًا. عند تحديد السعر ، غالبًا ما يعتمد أيضًا على ميزات المنزل مثل المفهوم والموقع وغرف النوم وما إلى ذلك. إن التنبؤ بأسعار المنازل بناءً على خصائصها (Random Forest) له أداء جيد في التنبؤ بأسعار المنازل. ومع ذلك ، فإن الطريقة (Random Forest) لها عيب أنه إذا كنت تستخدم الكثير من المتغيرات ، فستستغرق عملية التدريب وقتًا أطول ويميل اختيار الميزة إلى اختيار الميزات غير المفيدة. إحدى الطرق المستخدمة لتقليل الميزات دون الحاجة إلى إزالة الميزات الأخرى هي استخدام (Principal Component Analysis). الطريقة المستخدمة في هذا البحث هي (Principal Component Analysis) و (Random Forest). من نتائج تدريب النموذج ، يمكن استنتاج أن استخدام نتائج تقييم النموذج باستخدام (PCA) له معدل خطأ أقل وقيم أكثر اتساقًا ، بمتوسط 0.0253. في حين أن نتائج التقييم بدون (PCA) وباستخدام (Random Forest) فقط لها قيمة خطأ أعلى بمتوسط 0.03275. يتمتع وقت التدريب باستخدام نموذج PCA بوقت أسرع بمتوسط 5007 مللي ثانية ، في حين أن الوقت الذي يستخدم فقط (Random Forest) بدون (PCA) يبلغ متوسط وقت 6099 مللي ثانية.
ABSTRACT
Investment is an interesting thing, especially property investment. The developer must also be careful in determining the price of the property. It should be noted that every year, both short-term and long-term, property prices increase and rarely go down. In determining the price, it is often also based on the features of the house such as the concept, location, bedrooms, etc. To predict house prices based on their features, the random forest has a good performance for predicting house prices. However, the random forest method has the disadvantage that if you use too many variables, the training process will take longer and feature selection tends to select features that are not informative. One way to reduce features without removing other features is to use Principal Component Analysis. In this research, the method used is Principal Component Analysis (PCA) and Random Forest. From the results of model training, it can be concluded that the use of model evaluation results using PCA has a smaller error rate and more consistent values, with an average of 0.0253. While the results of the evaluation without PCA and using only Random Forest have a higher error value with an average of 0.03275. The training time using the PCA model has a faster time, with an average of 5007 milliseconds, while those using only random forest without PCA have an average time of 6099 milliseconds.
Item Type: | Thesis (Masters) |
---|---|
Supervisor: | Chamidy, Totok and Nugroho, Fresy |
Keywords: | Prediksi harga rumah; Metode Random Forest; Principal Component Analysis; House Price Prediction, Random Forest Method, Principal Component Analysis; الكلمات المفتاحية تنبؤات أسعار المساكن,(Random Forest),(Principal Component Analysis) |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080199 Artificial Intelligence and Image Processing not elsewhere classified |
Departement: | Fakultas Sains dan Teknologi > Jurusan Magister Tehnik Informatika |
Depositing User: | Emha Ahdan Fahmi Elmuna |
Date Deposited: | 26 May 2023 14:44 |
Last Modified: | 26 May 2023 14:44 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/50422 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |