Maulida, Rizka (2022) Perbandingan principal component regression dan regresi ridge pada analisis faktor-faktor indeks pembangunan manusia. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
18610020.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
INDONESIA:
Indeks Pembangunan Manusia (IPM) merupakan salah satu tolak ukur untuk menentukan pembangunan ekonomi. Provinsi Nusa Tenggara Timur masuk dalam 3 provinsi dengan indeks pembangunan manusia terendah. Pada model regresi linier berganda sering terjadi gejala multikolinieritas. Multikolinieritas adalah terjadinya korelasi linier antar sebagian atau seluruh variabel bebas yang menyebabkan estimasi parameter regresi tidak bisa ditaksir dengan akurat. Oleh karena itu, multikolinieritas perlu diatasi yaitu dengan metode principal component regression dan regresi ridge. Tujuan digunakannya metode tersebut adalah untuk mengatasi multikolinieritas yang tidak bisa dihilangkan dengan metode OLS. Principal component regression adalah regresi variabel terikat terhadap komponen utama yang tidak berkorelasi. Sedangkan, regresi ridge merupakan modifikasi dari metode OLS yaitu dengan menambahkan tetapan bias pada diagonal matriks X'X. Salah satu metode penentuan tetapan bias adalah Hoerl & Kennard. Data yang digunakan adalah data IPM Provinsi Nusa Tenggara Timur tahun 2021 yang dimodelkan menggunakan principal component regression dan regresi ridge menggunakan estimator parameter Hoerl & Kennard dengan melakukan langkah-langkah seperti uji asumsi klasik dan uji signifikansi parameter hingga diperoleh keakuratan model. Hasil analisis menggunakan metode OLS pada data IPM terdapat multikolinieritas yaitu variabel jumlah penduduk 〖(X〗_1) dan jumlah penduduk usia 15 tahun yang bekerja 〖(X〗_6) karena mempunyai nilai VIF lebih dari 10. Hasil analisis menggunakan principal component regression menghasilkan nilai VIF kurang dari 10. Sedangkan, hasil analisis menggunakan regresi ridge menggunakan estimator Hoerl & Kennard sebesar 0,2760 dan nilai VIF kurang dari 10. Kemudian, dari kedua metode dibandingkan berdasarkan R^2, R_adj,dan RSE. Berdasarkan hasil analisis diperoleh bahwa nilai R^2,R_adj dari regresi ridge lebih tinggi dibandingkan principal component regression dan RSE regresi ridge lebih kecil daripada principal component regression. Kemudian diperoleh selisih R_adj sebesar 7,95 % yang lebih besar dari α. Oleh karena itu, dapat disimpulkan bahwa model regresi ridge lebih baik daripada principal component regression dalam mengatasi multikolinieritas pada data IPM di Nusa Tenggara Timur.
ENGLISH:
The Human Development Index (HDI) is one of the benchmarks for determining economic development. East Nusa Tenggara Province is included in the three provinces with the lowest human development index. In the multiple linear regression model, symptoms of multicollinearity often occur. Multicollinearity is the occurrence of linear correlation between some or all of the independent variables which causes the estimated regression parameters cannot be estimated accurately. Therefore, multicollinearity needs to be overcome by using principal component regression and ridge regression methods. The purpose of using this method is to overcome multicollinearity that cannot be eliminated by the OLS method. Principal component regression is the regression of the dependent variable on the main component that is not correlated. Meanwhile, ridge regression is a modification of the OLS method by adding a bias constant to the diagonal of the X'X matrix. One method of determining the bias constant is Hoerl & Kennard. The data used is the HDI data of East Nusa Tenggara Province in 2021 which is modeled using principal component regression and ridge regression using the Hoerl & Kennard parameter estimator by performing steps such as classical assumption test and parameter significance test to obtain model accuracy. The results of the analysis using the OLS method on HDI data have multicollinearity, namely the variable number of residents 〖(X〗_1) and the number of people aged 15 years working (X_6) because they have a VIF value of more than 10. The results of the analysis using principal component regression resulted in a VIF value of less than 10. Meanwhile, the results of the analysis using ridge regression using the Hoerl & Kennard estimator were 0.2760 and the VIF value was less than 10. Then, the two methods were compared based on R^2,R_adj, and RSE. Based on the results of the analysis, it is found that the R^2,R_adj value of the ridge regression is higher than the principal component regression and the RSE of the ridge regression is smaller than the principal component regression. Then the difference in R_adj is 7.95% which is bigger than α. Therefore, it can be concluded that the ridge regression model is better than the principal component regression in overcoming multicollinearity in HDI data in East Nusa Tenggara.
ARABIC:
مؤشر التنمية البشرية هو أحد المعايير لتعيين التنمية الاقتصادي. تقع نوسا الجنوب الشرقي من المحافظات الثلاثة الأقل في مؤشر التنمية البشرية. وفي نموذج الانحدار الخطي المزدوج، غالبًا ما تحدث عرض الخطية المتعددة. وأما الخطية المتعددة هي حدوث العلاقة خطي بين بعض أو كل المتغيرات المستقلة التي تتسبب إلى عدم إمكانية تقدير معيار الانحدار المقدرة بدقة. لذلك، يجب الحل لوجود الخطية المتعددة انحدار المكون الرئيسي وانحدار ريدج. والغرض من استخدام هذه الطريقة لحل الخطية المتعددة التي لا ييتطيع أن تحلها بطريقة بطريقة نهاية المربع العادية (OLS). انحدار المكون الرئيسي هو انحدار المتغير التابع على المكون الرئيسي الذي غير المترابط. وأما انحدار ريدج هو تعديل لطريقة OLS وهو بإضافة ثابت التحيز إلى المصفوفة القطرية. وإحدى طرق لتعيين ثابت التحيز هو Hoerl&Kennard. والبيانات المستخدمة هي بيانات مؤشر التنمية البشرية لمحافظة نوسا تينجارا الشرقية عام 2021 والتي نمذجها باستخدام انحدار المكون الرئيسي وانحدار ريدج بمقدّر معيار Hoerl& Kennardبإجراء الخطوات مثل اختبار الافتراض الكلاسيكي واختبار معنوي المعيار للحصول على دقة النموذج. ودلت نتيجة التحليل بطريقة OLS لبيانات مؤشر التنمية البشرية إلى وجود علاقة الخطية المتعددة أي متغير عدد المسكان〖(X〗_1) وعدد السكان الذين يعملون في عمر 15 سنة 〖(X〗_6) لأن لديهم قيمة VIF تزيد عن 10. ونتيجة التحليل باستخدام انحدار المكون الرئيسيينتج قيمة VIF أقل من 10. وفي الوقت نفسه، استخدمت نتيجة التحليل انحدار ريدج باستخداممقدر Hoerl& Kennardيبلغ إلى,2760 0 وقيمة VIF أقل من 10. ثم تقارن الطريقتين بناءً على R^2 وR_adj وRSE. وبناءً على نتائج التحليل، وجد أن قيمة R^2 وR_adj من انحدار ريج أعلى من انحدار المكون الرئيسيوأن قيمة RSE من انحدار ريدج أصغر من انحدار المكون الرئيسي. ثم حصلنا على فارق R_adj 7.95٪ وهو أكبر من α.لذلك، يستنتاج أن انحدار ريدج أفضل من انحدار المكون الرئيسيفي الحل على الخطية المتعددة على البيانات المؤشرة التنمية البشرية في محافظة نوسا الجنوب الشرقي .
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Rozi, Fachrur and Jauhari, Mohammad Nafie | |||||||||
Contributors: |
|
|||||||||
Keywords: | IPM; Regresi; Metode Ordinary Least Square (OLS); Multikolinieritas; Principal Component Regression; Regresi Ridge; HDI; Regression; Ordinary Least Square (OLS) Method; Multicollinearity; Principal Component Regression; Ridge Regression;مؤشر التنمية البشرية; طريقة نهاية المربع العادية(Ordinary Least Square Method); متعدد الخطية; انحدار المكون الرئيسي (Principal Component Regression); انحدار ريدج (Ridge Regression) | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Matematika | |||||||||
Depositing User: | Rizka Maulida | |||||||||
Date Deposited: | 07 Jul 2022 14:38 | |||||||||
Last Modified: | 07 Jul 2022 14:38 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/37362 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |