Briliansyah, Faisal (2020) Sistem klasifikasi kategori berita menggunakan metode k-nearest neighbor. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
This is the latest version of this item.
|
Text (fulltext)
13650056.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) | Preview |
Abstract
ABSTRAK:
Informasi menjadi kebutuhan pokok bagi setiap orang, namun tidak semua informasi yang ada dapat menjadi kebutuhan. Dipengaruhi oleh kemajuan teknologi internet sehingga informasi mengalami pelonjakan yang besar, Karena kebutuhan masyarakat akan berita semakin meningkat setiap harinya, berbagai pihak mencoba untuk menyajikan sajian berita berbahasa Indonesia yang sesuai dengan kebutuhan masyarakat Indonesia secara cepat, tepat, akurat, dan terpercaya bagi para pembaca berita. Permasalahan yang muncul adalah penggunaan media digital dalam penyampaian informasi menyebabkan jumlah artikel berita digital yang dirilis oleh portal berita tiap harinya menjadi sangat banyak. Hal ini berdampak pada ketersediaan artikel berita yang jumlahnya sangat melimpah. Klasifikasi merupakan salah satu metode dalam text mining yang bertujuan untuk menentukan label atau kategori objek. Terdapat 4 kategori berita yang digunakan dalam penelitian, yaitu Olaharaga, Politik, Ekonomi, dan Teknologi. Dalam mendapatkan kategori berita digunakan metode K-Nearest Neighbor untuk menentukan tetangga terdekat suatu artikel berita. Pada penelitian ini dilakukan penerapan algoritma tersebut dalam sistem klasifikasi suatu kategori berita menggunakan bantuan web scrapping untuk mengambil berita secara online dari portal berita. Dalam penelitian pengklasifikasian menjadi 4 kategori berita berhasil melakukan pengujian untuk mencari nilai perhitungan akurasi sebesar 74 %, precision 35 %, recall 35 %, F- measure 35%, dan Specificity 84 % dan UAC 60% sehingga diperoleh hasil dengan nilai buruk untuk melakukan klasifikasi kategori berita.
ABSTRACT:
Information becomes a basic requirement for everyone, but not all information can be a necessity. Influenced by the advancement of internet technology so that information experiences a big surge, Because the public's needs for news are increasing every day, various parties try to present Indonesian language news content that is suitable for the needs of the Indonesian people in a fast, accurate, accurate and reliable way for news readers . The problem that arises is the use of digital media in the delivery of information causing the number of digital news articles released by the news portal every day to be very large. This has an impact on the availability of abundant news articles. Classification is one method in text mining that aims to determine labels or categories of objects. There are 4 categories of news used in research, namely sports, politics, economics, and technology. In getting the categories of news used the method K-Nearest Neighbor to determine the closest neighbor of a news article. In this research conducted the application of such algorithms in the classification system of a news category using the help of web scrapping to retrieve news online from the news portal. In classifying research into 4 categories of news successfully tested to find an accuracy calculation value of 74%, precision 35%, recall 35%, F-measure 35%, and Specificity %84% and UAC 60% so that the result with bad value to classify the news category.
مستخلص البحث:
المعلومات هي حاجة أساسية للجميع ، ولكن لا يمكن أن تكون هناك حاجة إلى جميع المعلومات. تأثر بالتقدم في تكنولوجيا الإنترنت بحيث تشهد المعلومات طفرة هائلة ، لأن احتياجات المجتمع للأخبار تتزايد كل يوم ، تحاول أطراف مختلفة تقديم عروض الأخبار الإندونيسية التي تتوافق مع احتياجات الشعب الإندونيسي بسرعة وبدقة ودقة وموثوقية لقراء الأخبار . المشكلة التي تنشأ هي استخدام الوسائط الرقمية في توصيل المعلومات ، مما يؤدي إلى زيادة عدد المقالات الإخبارية الرقمية التي تصدرها البوابة الإخبارية كل يوم. هذا له تأثير على توافر المقالات الإخبارية الوفيرة للغاية. التصنيف هو أحد الأساليب في استخراج النص الذي يهدف إلى تحديد تسمية أو فئة الكائنات. هناك 4 فئات من الأخبار يتم استخدامها في الأبحاث ، وهي الرياضة والسياسة والاقتصاد والتكنولوجيا. في الحصول على فئة الأخبار ، يتم استخدام طريقة ك-نيرست نيفبور لتحديد أقرب جار لمقال إخباري. في هذا البحث ، يستخدم تطبيق الخوارزمية في نظام التصنيف لفئة إخبارية مساعدة إلغاء الويب لاسترداد الأخبار عبر الإنترنت من بوابة الأخبار. في بحث التصنيف إلى 4 فئات إخبارية تم اختبارها بنجاح لإيجاد قيمة حساب دقة 74٪ ، دقة 35٪ ، استدعاء 35٪ ،ف- قياس 35٪ ، خصوصية 84٪ و UAC 60٪ بحيث النتائج التي تم الحصول عليها بقيمة سيئة للقيام بالتصنيف فئة الأخبار
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Crysdian, Cahyo and Nugroho, Fresy | |||||||||
Contributors: |
|
|||||||||
Keywords: | K-Nearest Neighbor; Klasifikasi Teks; Text Mining; Web Scrapping; Text classification; ك-نيرست نيفبور ; تحليل النصوص ،تصنيف النص; تجريف على شبكة الإنترنت | |||||||||
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining 08 INFORMATION AND COMPUTING SCIENCES > 0802 Computation Theory and Mathematics > 080201 Analysis of Algorithms and Complexity 08 INFORMATION AND COMPUTING SCIENCES > 0806 Information Systems > 080611 Information Systems Theory |
|||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Faisal Briliansyah | |||||||||
Date Deposited: | 10 Aug 2020 14:18 | |||||||||
Last Modified: | 10 Aug 2020 14:18 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/18635 |
Downloads
Downloads per month over past year
Available Versions of this Item
-
Sistem Klasifikasi Kategori Berita Menggunakan Metode K-Nearest Neighbor. (deposited UNSPECIFIED)
- Sistem klasifikasi kategori berita menggunakan metode k-nearest neighbor. (deposited 10 Aug 2020 14:18) [Currently Displayed]
Actions (login required)
View Item |