Responsive Banner

Optimasi model XGBoost menggunakan SMOTE dan PCA untuk klasifikasi serangan Siber pada Internet of Things

Ramadan, Afrijal Rizqi (2025) Optimasi model XGBoost menggunakan SMOTE dan PCA untuk klasifikasi serangan Siber pada Internet of Things. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
210605220001.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(4MB)

Abstract

ABSTRAK

Kemajuan teknologi Internet of Things (IoT) telah mendorong transformasi signifikan di berbagai bidang. Namun, meningkatnya penggunaan IoT juga memperbesar risiko keamanan siber karena keterbatasan sumber daya dan lemahnya mekanisme pertahanan perangkat. Kondisi ini menimbulkan kebutuhan akan model klasifikasi yang kuat dan efisien untuk mendeteksi berbagai jenis serangan. Penelitian ini berfokus pada optimasi kinerja sistem klasifikasi serangan siber pada Internet of Things (IoT) menggunakan pendekatan algoritma Extreme Gradient Boosting (XGBoost). Kesenjangan utama yang diidentifikasi adalah adanya ketidakseimbangan data serta redundansi fitur yang muncul pada dataset IoT. Untuk mengatasi hal tersebut, penelitian ini mengembangkan model XGBSP-E5, yaitu kombinasi antara XGBoost, Synthetic Minority Oversampling Technique (SMOTE), dan Principal Component Analysis (PCA). Dataset yang digunakan terdiri dari 350.000 data serangan IoT yang telah melalui proses pra-pemrosesan dan pembagian data dengan rasio 90:10 untuk pelatihan dan pengujian. Hasil penelitian menunjukkan bahwa model XGBSP-E5 memberikan hasil akurasi 99,68%, presisi 96%, recall 95%, F1-score 95% menunjukkan kemampuan deteksi yang baik terhadap jenis serangan. Temuan ini menegaskan bahwa penerapan kombinasi SMOTE dan PCA pada model XGBoost dapat digunakan dalam melakukan klasifikasi serangan siber pada IoT.

ABSTRACT

The technological advance of the Internet of Things (IoT) has driven a significant transformation in numerous fields. However, its increasing use also escalates cybersecurity risks due to the limited resources and weak security mechanisms of the hardware. These conditions urge the need for a strong and efficient classification model to detect diverse types of attacks. The research focuses on optimizing the performance of cyberattack classification systems in the IoT environment using the Extreme Gradient Boosting (XGBoost) algorithm. The primary gap identified lies in the presence of data imbalance and feature redundancy within IoT datasets. To solve these issues, the research develops the XGBSP-E5 model, a combination of XGBoost, the Synthetic Minority Oversampling Technique (SMOTE), and Principal Component Analysis (PCA). The research dataset comprises 350,000 IoT attack records that have undergone preprocessing and were split into training and testing sets at a 90:10 ratio. The research results demonstrate that the XGBSP-E5 model achieves 99.68% accuracy, 96% precision, 95% recall, and a 95% F1-score, indicating strong detection capability across attack types. These results affirm that integrating SMOTE and PCA with the XGBoost model can be used to classify cyberattacks in IoT systems.

مستخلص البحث

لقد دفع التقدم في تكنولوجيا إنترنت الأشياء (IoT) إلى تحولات كبيرة في مختلف المجالات. ومع ذلك، فإن الاستخدام المتزايد لـ IoT يزيد أيضًا من مخاطر الأمن السيبراني بسبب محدودية الموارد وضعف آليات الدفاع للأجهزة. تثير هذه الحالة الحاجة إلى نماذج تصنيف قوية وفعّالة للكشف عن أنواع متنوعة من الهجمات. تركز هذه الرسالة على تحسين أداء نظام تصنيف الهجمات السيبرانية على إنترنت الأشياء (IoT) باستخدام خوارزمية التعزيز التدريجي المتطرف (XGBoost). ومن الفجوات الرئيسة التي تم تحديدها وجود عدم توازن في البيانات بالإضافة إلى التكرار في الميزات التي تظهر في مجموعة بيانات إنترنت الأشياء (IoT). وللتغلب على ذلك، طورت هذه الرسالة نموذج XGBSP-E5، وهو مزيج بين XGBoost وتقنية الإفراط في أخذ العينات الاصطناعية للأقلية (SMOTE) وتحليل المكونات الرئيسية (PCA). تتألف مجموعة البيانات المستخدمة من 350,000 بيانات لهجمات إنترنت الأشياء تم تمريرها عبر عملية ما قبل المعالجة وتقسيم البيانات بنسبة 90:10 للتدريب والاختبار. أظهرت النتائج أن نموذج XGBSP-E5 حقق دقة بنسبة 99.68٪، وثبات بنسبة 96٪، والاستدعاء 95٪، ودرجة-ف1 95٪، مما يدل على قدرة جيدة على اكتشاف أنواع الهجمات. تؤكد هذه النتائج أن تطبيق مزيج من SMOTE وPCA على نموذج XGBoost يمكن استخدامه في تصنيف الهجمات السيبرانية على إنترنت الأشياء.

Item Type: Thesis (Masters)
Supervisor: Hariyadi, Mokhamad Amin and Almais, Agung Teguh Wibowo
Keywords: Serangan Siber; Internet of Things; Smart City; XGBoost; Principal Component Analysis; Synthetic Minority Oversampling Technique; Cyberattack; هجمات سيبرانية; إنترنت أشياء; مدينة ذكية; تحليل مكونات رئيسية، تقنية إفراط في أخذ عينات اصطناعية لأقلية
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining
08 INFORMATION AND COMPUTING SCIENCES > 0803 Computer Software > 080303 Computer System Security
08 INFORMATION AND COMPUTING SCIENCES > 0805 Distributed Computing > 080503 Networking and Communications
10 TECHNOLOGY > 1005 Communications Technologies > 100510 Wireless Communications
Departement: Fakultas Sains dan Teknologi > Jurusan Magister Tehnik Informatika
Depositing User: Afrijal Rizqi Ramadan
Date Deposited: 28 Nov 2025 13:31
Last Modified: 28 Nov 2025 13:31
URI: http://etheses.uin-malang.ac.id/id/eprint/81327

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item