Responsive Banner

Klasifikasi kualitas air minum menggunakan algoritma K-Nearest Neighbor

Fadilah, Qanita Farah (2025) Klasifikasi kualitas air minum menggunakan algoritma K-Nearest Neighbor. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Full text)
19650139.pdf - Accepted Version
Available under License Creative Commons Attribution No Derivatives.

(3MB)

Abstract

INDONESIA:

Kualitas air yang aman untuk dikonsumsi merupakan faktor penting bagi kesehatan masyarakat. Sistem yang dapat mengklasifikasikan kualitas air minum secara cepat dan akurat sangat diperlukan guna mencegah tercemarnya air yang dapat menimbulkan berbagai penyakit. Penelitian ini dilakukan untuk mengklasifikasikan kualitas air yang layak dikonsumsi atau tidak menggunakan algoritma K-Nearest Neighbor berdasarkan parameter fisika dan kimia seperti pH, kekeruhan, TDS, dan kandungan sulfat. Algoritma ini digunakan dalam menghitung probabilitas kualitas air yang layak atau tidak layak dikonsumsi. Data yang digunakan dalam penelitian ini diambil dari website Kaggle sebanyak 3.276 data yang akan diproses melalui tahap preprocessing data, normalisasi, penyeimbangan data, serta penerapan algoritma KNN dengan perbandingan rasio data dan jumlah nilai k. Hasil evaluasi dari model yang dihasilkan diukur menggunakan tabel Confusion Matrix yang menghasilkan tingkat akurasi tertinggi 68%, presisi 73%, recall 63%, dan f1-score 67% dengan nilai k (tetangga terdekat) = 3 dan rasio perbandingan data 90:10. Hasil akurasi tersebut menunjukkan bahwa metode KNN cukup efektif dalam mengklasifikasikan kualitas air minum.

ENGLISH:

The quality of water that is safe for consumption is an important factor for public health. A system that can classify the quality of drinking water quickly and accurately is needed to prevent water contamination that can cause various diseases. This research was conducted to classify the quality of water that is suitable for consumption or not using the K-Nearest Neighbor algorithm based on physical and chemical parameters such as pH, turbidity, TDS, and sulfate content. This algorithm is used in calculating the probability of water quality that is suitable or not suitable for consumption. The data used in this study were taken from the Kaggle website as much as 3,276 data which will be processed through the stages of data preprocessing, normalization, data balancing, and application of the KNN algorithm with a comparison of data ratios and the number of k values. The evaluation results of the resulting model are measured using the Confusion Matrix table which produces the highest accuracy rate of 68%, precision 73%, recall 63%, and f1-score 67% with a value of k (nearest neighbor) = 3 and a data comparison ratio of 90:10. The accuracy results show that the KNN method is quite effective in classifying drinking water quality.

ARABIC :

جودة المياه الصالحة للاستهلاك عاملٌ مهمٌّ للصحة العامة، ويتطلب الأمر نظامًا قادرًا على تصنيف جودة مياه الشرب بسرعة ودقة لمنع تلوث المياه الذي قد يُسبب أمراضًا مُختلفة. أُجري هذا البحث لتصنيف جودة المياه الصالحة للاستهلاك أو غير الصالحة باستخدام خوارزمية “ك-أقرب جار” بناءً على المعايير الفيزيائية والكيميائية مثل الرقم الهيدروجيني، والعكارة، والمواد الصلبة الذائبة، ومحتوى الكبريتات. يتم استخدام هذه الخوارزمية لحساب احتمالية كون جودة المياه مناسبة أو غير مناسبة للاستهلاك. تم أخذ البيانات المستخدمة في هذه الدراسة من موقع Kaggle الإلكتروني بما يصل إلى ٣.٢٧٦ بيانات والتي سيتم معالجتها من خلال مراحل معالجة البيانات المسبقة، والتطبيع، وموازنة البيانات، وتطبيق خوارزمية ك-أقرب جار مع مقارنة نسب البيانات وعدد قيم ك. تم قياس نتائج تقييم النموذج الناتج باستخدام جدول مصفوفة الارتباك الذي أنتج أعلى مستوى دقة بنسبة ٦٨، ودقة بنسبة ٧٣٪، واسترجاع بنسبة ٦٣٪، ونتيجة ف١ بنسبة ٦٧٪ بقيمة ك (أقرب جار) = ٣ ونسبة مقارنة البيانات ٩٠:١٠. وتظهر نتائج الدقة أن طريقة ك-أقرب جار فعالة جدًا في تصنيف جودة مياه الشرب.

Item Type: Thesis (Undergraduate)
Supervisor: Hariyadi, M. Amin and Santoso, Irwan Budi
Keywords: Kualitas Air; Klasifikasi; K-Nearest Neighbor Water Quality; Classification; K-Nearest Neighbor. جودة املياه، التصنيف،أقرب جار
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Qanita Farah Fadilah
Date Deposited: 24 Jul 2025 09:58
Last Modified: 24 Jul 2025 09:58
URI: http://etheses.uin-malang.ac.id/id/eprint/80474

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item