Responsive Banner

Seleksi fitur menggunakan Symmetrical Uncertainty pada prediksi cacat perangkat lunak

Roihan, Ahmad (2018) Seleksi fitur menggunakan Symmetrical Uncertainty pada prediksi cacat perangkat lunak. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
14650082.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB) | Preview

Abstract

مستخلص البحث

توصف عيوب البرمجيات أنها عيوب في البرمجيات كالعيوب الموجودة في الوثيقة ورمز البرنامج والتخطيط وغيرها من الأشياء التي تؤدي إلى فشل البرمجيات. ومن الطرق التي يمكن القيام بها للتقصير عن حدوث عيوب البرمجيات هي تقنية تنبؤ عيوب البرمجيات باستخدام برنامج بيانات المقاييس (Metrics Data Program (MDP)). ولكن ليس لكل الميزات في مجموعة البيانات تأثير كبير على تنبؤ عيوب البرمجيات إذ لا تخصص تلك مجموعة البيانات لتنبؤ عيوب البرمجيات. لذلك، تعد عملية اختيار الميزة ضروريا للحصول على الميزات المؤثرة على التنبؤ من عيوب البرمجيات.

يقوم هذا البحث باختيار الميزات باستخدام اختيار ميزة إبهام المتماثل مع عدد أخذ الميزات المختلفة التي تهدف إلى الحصول على الميزات الأكثر تأثيراً أو الأصوب. واستنتجت نتيجة هذا البحث إلى أن الميزة الصائبة لتنبؤ عيوب البرمجيات اعتمادا على اختيار ميزة إبهام المتماثل لمجموعة البيانات CM1 هي ميزة Time to write program (t). ولمجموعة البيانات JM1 هي ميزات total operand (total_Opnd)، وunique operands (uniq_Opnd)، وtotal operator (total_Op)، وunique operators (uniq_Op)، و Intelligence (i)، و Programlength (l)، و Difficulty (d)، و Volume (v)، و Error estimate (b)، و line count of code (loc)، و Cyclomatic complexity (v(g))، و Essential complexit (ev(g))، و Total‎operator‎+‎operand (n)، و Count of Statement Lines (IOCode)، و Time to write program (t)، و Effort to write program (e)، و Design complexity (iv(g))، و Branch count (branchCount)، و lOComment. ولمجموعة البيانات KC1. هي ميزة Difficulty (d). ولمجموعة البيانات PC1 هي ميزة Count of lines of comments (lOComment). واعتمادا على تجربة التصنيف فتكون هذه الميزات المذكورة تحصل على أحسن الدقة.

ABSTRACT

Software defects are defined as defects in software such as defects in documentation, program code, design and other things that cause software failure. One way that can be done to minimize the occurrence of software defects is the software defect prediction technique using the dataset Metrics Data Program (MDP). However, not all features in the dataset have a major influence on the prediction of software defects because the dataset is not specifically for software defects. Therefore, feature selection is needed to get features that affect the prediction of software defects.

This study selected features using the Symmetrical Uncertainty feature selection with the number of different features taken with the aim of getting the most influential or relevant features. The results of this study concluded that the relevant feature of the prediction of software defects based on the Symmetrical Uncertainty feature selection on the CM1 dataset is the Time to write program (t) feature. The JM1 dataset is a feature of total operand (total_Opnd), unique operands (uniq_Opnd), total operator (total_Op), unique operators (uniq_Op), Intelligence (i), Programlength (l), Difficulty (d), Volume (v), Error estimate (b), line count of code (loc), Cyclomatic complexity (v (g)), Essential complexit (ev (g)), Total operator + operand (n), Count of Statement Lines (IOCode), Time write program (t), Effort to write program (e), complexity design (iv (g)), Branch count (branchCount) and lOComment. The KC1 dataset is a Difficulty feature (the KC2 dataset is Difficulty (d). The PC1 dataset is a feature of Count of lines of comments (lOComment). Based on the classification trials these features produce the best accuracy.

ABSTRAK

Cacat perangkat lunak didefinisikan sebagai cacat pada perangkat lunak seperti cacat pada dokumentasi, pada kode program, pada desain dan hal – hal lain yang menyebabkan kegagalan perangkat lunak. Salah satu cara yang bisa dilakukan untuk meminimalisir terjadinya cacat perangkat lunak adalah teknik prediksi cacat perangkat lunak menggunakan dataset Metrics Data Program (MDP). Namun tidak semua fitur yang ada pada dataset memiliki pengaruh besar terhadap prediksi cacat perangkat lunak karena dataset tersebut dibuat tidak khusus untuk pediksi cacat perangkat lunak. Oleh karena itu, seleksi fitur diperlukan untuk mendapatkan fitur yang berpengaruh terhadap prediksi cacat perangkat lunak.

Penelitian ini melakukan pemilihan fitur menggunakan seleksi fitur Symmetrical Uncertainty dengan jumlah pengambilan fitur yang berbeda-beda dengan tujuan mendapatkan fitur yang paling berpengaruh atau relevan. Hasil dari penelitian ini menyimpulkan bahwa fitur yang relevan terhadap prediksi cacat perangkat lunak berdasarkan seleksi fitur Symmetrical Uncertainty pada dataset CM1 adalah fitur Time to write program (t). Dataset JM1 adalah fitur total operand (total_Opnd), unique operands (uniq_Opnd), total operator (total_Op), unique operators (uniq_Op), Intelligence (i), Programlength (l), Difficulty (d), Volume (v), Error estimate (b), line count of code (loc), Cyclomatic complexity (v(g)), Essential complexit (ev(g)), Total‎operator‎+‎operand (n), Count of Statement Lines (IOCode), Time to write program (t), Effort to write program (e), Design complexity (iv(g)), Branch count (branchCount) dan lOComment. Dataset KC1 adalah fitur Difficulty (d). Dataset KC2 adalah Difficulty (d). Dataset PC1 adalah fitur Count of lines of comments (lOComment). erdasarkan uji coba klasifikasi fitur-fitur tersebut menghasilkan akurasi terbaik.

Item Type: Thesis (Undergraduate)
Supervisor: Fatchurrochman, Fatchurrochman and Santoso, Irwan Budi
Contributors:
ContributionNameEmail
UNSPECIFIEDFatchurrochman, FatchurrochmanUNSPECIFIED
UNSPECIFIEDSantoso, Irwan BudiUNSPECIFIED
Keywords: تنبؤ عيوب البرمجيات; اختيار الميزة إبهام المتماثل; software defect prediction; feature selection Symmetrical Uncertainty; prediksi cacat perangkat lunak; seleksi fitur Symmetrical Uncertainty
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Mohammad Syahriel Ar
Date Deposited: 17 Dec 2018 15:30
Last Modified: 17 Dec 2018 15:30
URI: http://etheses.uin-malang.ac.id/id/eprint/12767

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item