Mellina, Ayu Dian Fitri (2023) Prediksi deteksi penyakit kanker payudara dengan menggunakan algoritma decision tree. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
17650087.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (9MB) | Preview |
Abstract
INDONESIA:
Kanker merupakan salah satu penyakit pembunuh terbesar di dunia dan sulit untuk disembuhkan. Deteksi dini kanker dapat dilakukan melalui serangkaian uji laboratorium yang dapat mengidentifikasi kanker jinak atau ganas. Kanker payudara termasuk dalam jenis kanker ganas dan memiliki gejala awal berupa benjolan yang semakin membesar. Data mining, khususnya metode klasifikasi, dapat digunakan untuk menganalisis data uji laboratorium dan mengkategorikan kanker payudara menjadi jinak dan ganas. Decision tree adalah metode klasifikasi yang digunakan dalam penelitian ini, dengan algoritma iterative dichotomiser-3 (ID3) dan C5.0 sebagai pilihan untuk deteksi kanker payudara. Data yang digunakan pada penelitian ini merupakan Breast Cancer Coimbra Dataset yang dapat diunduh secara gratis di website resmi UCI Machine Learning tahun 2018. iterative dichotomiser-3 (ID3) memiliki keterbatasan dalam menangani data tidak terstruktur dan atribut kontinu, sementara C5.0 merupakan pengembangan dari iterative dichotomiser-3 (ID3) yang lebih baik dalam menangani jenis data tersebut. Kedua algoritma ini menghasilkan model pohon yang berbeda dengan tingkat keakuratan yang bervariasi. Hasil dari penelitian ini menunjukan bahwa algoritma C5.0 memperoleh hasil klasifikasi terbaik dibandingkan dengan algoritma iterative dichotomiser-3 (ID3) dengan nilai accuracy sebesar 80%, precision sebesar 84,2%, recall sebesar 80%, dan F1 score sebesar 80%. Nilai accuracy sebesar 80% menyatakan bahwa sistem dapat melakukan klasifikasi dengan baik sehingga model algoritma C5.0 dapat diterima dan dapat digunakan untuk memprediksi deteksi penyakit kanker payudara.
ENGLISH:
Cancer is one of the biggest killers in the world and difficult to cure. Early detection of cancer can be done through a series of laboratory tests that can identify benign or malignant cancer. Breast cancer is a type of malignant cancer and has early symptoms in the form of a growing lump. Data mining, especially the classification method, can be used to analyze laboratory test data and categorize breast cancer into benign and malignant. Decision tree is the classification method used in this study, with iterative dichotomizer-3 (ID3) and C5.0 algorithms as the choice for breast cancer detection. The data used in this study is the Breast Cancer Coimbra Dataset which can be downloaded for free on the official UCI Machine Learning website in 2018. Iterative dichotomizer-3 (ID3) has limitations in handling unstructured data and continuous attributes, while C5.0 is a development of iterative dichotomiser-3 (ID3) which is better at handling this type of data. These two algorithms produce different tree models with varying degrees of accuracy. The results of this study indicate that the C5.0 algorithm obtains the best classification results compared to the iterative dichotomous-3 (ID3) algorithm with an accuracy value of 80%, a precision of 84.2%, a recall of 80%, and an F1 score of 80%. An accuracy value of 80% indicates that the system can perform the classification properly so that the C5.0 algorithm model is acceptable and can be used to predict breast cancer detection.
ARABIC:
السرطان هو أحد أكبر الأمراض الفتاكة في العالم ويصعب علاجه. يمكن الكشف المبكر عن السرطان من خلال سلسلة من الاختبارات المعملية التي يمكن أن تحدد السرطان الحميد أو الخبيث. سرطان الثدي هو نوع من السرطانات الخبيثة وله أعراض مبكرة على شكل كتلة متنامية. يمكن استخدام التنقيب عن البيانات ، وخاصة طريقة التصنيف ، لتحليل بيانات الاختبارات المعملية وتصنيف سرطان الثدي إلى حميدة وخبيثة. شجرة القرار هي طريقة التصنيف المستخدمة في هذه الدراسة ، مع خوارزميات ثنائية التكرار 3 (ID3) و C5.0 كخيار للكشف عن سرطان الثدي. البيانات المستخدمة في هذه الدراسة هي مجموعة بيانات Coimbra لسرطان الثدي والتي يمكن تنزيلها مجانًا على موقع UCI Machine Learning الرسمي في عام 2018. يوجد قيود في التعامل مع البيانات غير المنظمة والسمات المستمرة ، بينما C5.0 هو تطوير dichotomiser التكراري 3 (ID3) وهو أفضل في التعامل مع هذا النوع من البيانات. تنتج هاتان الخوارزميتان نماذج شجرية مختلفة بدرجات متفاوتة من الدقة. تشير نتائج هذه الدراسة إلى أن خوارزمية C5.0 تحصل على أفضل نتائج التصنيف مقارنة بالخوارزمية التكرارية ثنائية التفرع -3 (ID3) بقيمة دقة 80٪ ودقة 84.2٪ واسترجاع 80٪ و درجة F1 بنسبة 80٪. تشير قيمة الدقة البالغة 80٪ إلى أن النظام يمكنه إجراء التصنيف بشكل صحيح بحيث يكون نموذج خوارزمية C5.0 مقبولًا ويمكن استخدامه للتنبؤ باكتشاف سرطان الثدي
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Suhartono, Suhartono and Yaqin, M. Ainul |
Keywords: | Kanker Payudara; Klasifikasi; Prediksi; Decision Tree; Machine Learning; Breast Cancer; Classification; Prediction; Machine Learning; سرطان الثدي; التصنيف; التنبؤ; شجرة القرار; التعلم الآلي |
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining 08 INFORMATION AND COMPUTING SCIENCES > 0803 Computer Software > 080301 Bioinformatics Software 08 INFORMATION AND COMPUTING SCIENCES > 0806 Information Systems > 080605 Decision Support and Group Support Systems |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Ayu Dian Fitri Mellina |
Date Deposited: | 15 Aug 2023 14:34 |
Last Modified: | 15 Aug 2023 14:34 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/53151 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |