Kartanegara, Moh Alamsyah Adi (2022) Mengukur tingkat similarity antara source code satu dan lainnya pada bahasa pemrograman java menggunakan algoritma levenshtein distance. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
15650068.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) |
Abstract
INDONESIA:
Plagiarisme merupakan tindakan mengambil karya orang lain tanpa mencantumkan sumber aslinya, yang di mana hal tersebut terlarang, terlebih lagi di dunia akademis. Di dunia pemrograman, source code merupakan hal yang penting untuk membangun sebuah aplikasi. Algoritma Levenshtein Distance yang fungsi utamanya untuk mengukur jarak antara dua string, digunakan untuk mengukur persentase similarity pada source code bahasa pemrograman Java. Pada penelitian ini, data uji source code yang digunakan sebanyak 20 data, di mana sistem membandingkan satu source code kepada banyak source code. Hal ini dilakukan melalui 4 skenario uji coba, yaitu menggunakan Levenshtein Distance autentik, Levenshtein Distance ditambah preprocessing casefolding, Levenshtein Distance ditambah preprocessing filtering, dan yang terakhir Levenshtein Distance ditambah preprocessing case folding dan filtering. Dari keempat skenario tersebut, didapatkan hasil paling signifikan pada skenario kedua, yaitu berupa penghitungan dengan algoritma levenshtein distance ditambah tahapan preprocessing case folding, yaitu accuracy sebesar 84,2%, precision 89,4%, recall 87,6%, dan F-1 Score 87,9%.
ENGLISH:
Plagiarism is the act of taking someone else's work without acknowledging the original source, which is forbidden, especially in academia. In the world of programming, source code is an important thing to build an application. The Levenshtein Distance algorithm whose main function is to measure the distance between two strings , is used to measure the percentage of similarity in the Java programming language source code . In this study, the source code test data used as many as 20 data, where the system compares one source code to many source codes . This is done through 4 test scenarios, namely using authentic Levenshtein Distance, Levenshtein Distance plus preprocessing casefolding, Levenshtein Distance plus preprocessing filtering, and the last Levenshtein Distance plus preprocessing case folding and filtering. Of the four scenarios, the most significant results were obtained in the second scenario, namely in the form of calculations using the Levenshtein distance algorithm plus the preprocessing case folding stage , namely 84.2% accuracy , 89.4% precision , 87.6% recall , and F-1 Score 87.9%.
ARABIC:
السرقة الأدبية هي أخذ عمل شخص آخر دون الاعتراف بالمصدر الأصلي ، وهو أمر ممنوع خاصة في الأوساط الأكاديمية. في عالم البرمجة ، يعد الكود المصدري أمرًا مهمًا لبناء تطبيق. تُستخدم خوارزمية Levenshtein Distance التي تتمثل وظيفتها الرئيسية في قياس المسافة بين سلسلتين ، في قياس النسبة المئوية للتشابه في كود مصدر لغة برمجة Java . في هذه الدراسة ، استخدمت بيانات اختبار كود المصدر ما يصل إلى 20 بيانات ، حيث يقارن النظام كود مصدر واحد بالعديد من أكواد المصدر . يتم ذلك من خلال 4 سيناريوهات اختبار ، وهي استخدام Levenshtein Distance الأصيلة ، و Levenshtein Distance بالإضافة إلى Casefolding مسبقة المعالجة ، و Levenshtein Distance بالإضافة إلى تصفية المعالجة المسبقة ، وآخر مسافة Levenshtein بالإضافة إلى حالة المعالجة المسبقة قابلة للطي والتصفية . من بين السيناريوهات الأربعة ، تم الحصول على أهم النتائج في السيناريو الثاني ، أي في شكل حسابات باستخدام خوارزمية المسافة Levenshtein بالإضافة إلى مرحلة طي علبة المعالجة المسبقة ، وهي دقة 84.2٪ ، دقة 89.4٪ ، استرجاع 87.6٪ ، و F- 1 النتيجة 87.9٪.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Suhartono, Suhartono and Melani, Roro Inda | |||||||||
Contributors: |
|
|||||||||
Keywords: | Java; Levenshtein Distance; Pemrograman; Plagiarisme; Source Code. Java, Levenshtein Distance , Programming, Plagiarism , Source Code. ردصلما دوك ،لاحتنلاا. | |||||||||
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0803 Computer Software > 080308 Programming Languages | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | mohammad alamsyah adi kartanegara | |||||||||
Date Deposited: | 12 Jul 2022 09:58 | |||||||||
Last Modified: | 12 Jul 2022 09:58 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/38539 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |