Risdianto, Aradea Atfal (2021) Klasifikasi dokumen perundang-undangan menggunakan metode Jaringan Saraf Tiruan. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text (Fulltext)
17650097_Aradea Atfal Risdianto_Skripsi.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
INDONESIA:
Peraturan perundang-undangan setiap tahun semakin bertambah jumlahnya mengikuti kondisi Negara, dengan begitu dapat dikatakan bahwa peraturan perundangan-undangan sangat banyak jumlahnya dan tidak akan berhenti bertambah. Dengan jumlah yang sangat banyak itu, ternyata belum ada yang pernah melakukan pengelompokan dokumen perundang-undangan, baik dari pihak institusi maupun pemerintah itu sendiri, hal itu menyebabkan dokumen tercecer. Oleh karena itu perlu dibuat pembelajaran mesin yang dapat mengklasifikasikan dokumen secara otomatis berdasarkan kelas Kementerian. Mesin pembelajaran akan dibangun dengan menerapkan metode Jaringan Saraf Tiruan. Penelitian ini bertujuan untuk mengukur kinerja sistem yang dibangun dengan Jaringan Saraf Tiruan, kinerja yang di ukur meliputi rata rata akurasi, presisi, recall dan f-measure. Metode ini digunakan karena dapat menciptakan pola berdasarkan data yang digunakan dalam proses pembelajaran. Dokumen yang telah dikumpulkan akan di ekstrak teksnya yang akan dilakukan tahap preprocessing meliputi tokenizing, case folding, filtertin dan stemming. Setelah hasil preprocessing didapatkan, kemudian akan dihitung frekuensi setiap kata pada setiap dokumen. Frekuensi inilah yang nantinya akan digunakan sebagai nilai input pada Jaringan Saraf Tiruan. Untuk mendapatkan hasil yang klasifikasi yang baik, maka sistem dilatih dengan menerapkan algoritme backpropagation dalam pembaruan bobot dan bias. Proses latih dilakukan menggunakan 2.562 dokumen dan error berhenti mengecil pada epoch ke 2213 dengan RMSE sebesar 0,135025146551841. Penelitian ini juga penulis melakukan peningkatan pada proses validasi model, hal ini dilakukan dengan menerapkan metode K-Fold Cross Validation sebagai pembanding. Pada pengujian yang penulis lakukan, maka didapatkan hasil akurasi 98,19%, presisi 90,95%, recall 90,95% dan f-measure 90,95% untuk pengujian orisinil dan untuk hasil dari K-fold Cross Validation didapatkan rata-rata nilai akurasi 98,27%, presisi 91,38%, recall 91,38% dan f-measure 91,38%.
ENGLISH:
The number of statutory regulations increases every year according to the condition of the State, so it can be said that the number of laws and regulations will not stop increasing. With such a large number, it turns out that no one has ever grouped statutory documents, either from the institution or the government itself, causing the documents to be scattered. Therefore it is necessary to make machine learning that can classify documents automatically based on Ministry class. Machine learning will be built by applying the Neural Network method. This study aims to measure the performance of a system built with an artificial neural network, the performance measured includes the average accuracy, precision, recall and f-measure.. This method is used because it can create patterns based on the data used in the learning process. The documents that have been collected will be extracted from the text which will be carried out in the preprocessing stage including tokenizing, case folding, filtering and stemming. After the preprocessing results are obtained, the frequency of each word in each document will then be calculated. This frequency will be used as the input value for the Artificial Neural Network. To get good classification results, the system is trained by applying the backpropagation algorithm in the weight and bias updates. The training process was carried out using 2,562 documents and the error stopped decreasing at the 2213 epoch with an RMSE of 0.135025146551841. In this study, the authors also made improvements to the model validation process, this was done by applying the K-Fold Cross Validation method as a comparison. In the test that the author did, the results obtained were 98.19% accuracy, 90.95% precision, 90.95% recall and 90.95% f-measure for the original test and for the results of K-fold Cross Validation obtained an average value of 98.27% accuracy, 91.38% precision, 91.38% recall and 91.38% f-measure.
ARAB:
يزداد عدد اللوائح القانونية كل عام حسب حالة الدولة ، لذلك يمكن القول أن عدد القوانين واللوائح لن يتوقف عن الازدياد. مع هذا العدد الكبير ، اتضح أنه لم يقم أحد على الإطلاق بتجميع الوثائق القانونية ، سواء من المؤسسة أو من الحكومة نفسها ، مما تسبب في تناثر الوثائق. لذلك من الضروري عمل تعلم آلي يمكنه تصنيف المستندات تلقائيًا بناءً على فئة الوزارة. سيتم بناء التعلم الآلي من خلال تطبيق طريقة الشبكة العصبية. تهدف هذه الدراسة إلى قياس أداء نظام مبني بشبكة عصبية اصطناعية ، ويشمل الأداء المقاس متوسط الدقة والدقة والاستدعاء والقياس .تُستخدم هذه الطريقة لأنها يمكن أن تخلق أنماطًا بناءً على البيانات المستخدمة في عملية التعلم. سيتم استخراج المستندات التي تم جمعها من النص الذي سيتم تنفيذه في مرحلة ما قبل المعالجة بما في ذلك الترميز وطي العلبة والترشيح والاشتقاق. بعد الحصول على نتائج المعالجة المسبقة ، سيتم بعد ذلك حساب تكرار كل كلمة في كل مستند. سيتم استخدام هذا التردد كقيمة إدخال للشبكة العصبية الاصطناعية. للحصول على نتائج تصنيف جيدة ، يتم تدريب النظام من خلال تطبيق خوارزمية الانتشار العكسي في تحديثات الوزن والتحيز. تم تنفيذ عملية التدريب باستخدام 2562 مستندًا وتوقف الخطأ عن التناقص في حقبة 2213 مع RMSE يبلغ 0.135025146551841. في هذه الدراسة ، قام المؤلفون أيضًا بإجراء تحسينات على عملية التحقق من صحة النموذج ، وتم ذلك من خلال تطبيق طريقة K-Fold Cross Validation كمقارنةفي الاختبار الذي قام به المؤلف ، كانت النتائج التي تم الحصول عليها ٪98.19 دقة ، ٪90.95 دقة ، ٪90.95 استرجاع و ٪90.95 قياس f للاختبار الأصلي ولنتائج K-fold Cross Validation التي حصلت على متوسط قيمة ٪98.27 الدقة ، ٪91.38 دقة ، ٪91.38 استدعاء و ٪91.38-f قياس. 91.38٪.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Crysdian, Cahyo and Syauqi, A’la | |||||||||
Contributors: |
|
|||||||||
Keywords: | Natural Language Processing; Klasifikasi Dokumen; Jaringan Saraf Tiruan; Document Classification; Artificial Neural Network; معالجة اللغة الطبيعية ; تصنيف الوثائق ; الشبكات العصبية الاصطناعية. | |||||||||
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Aradea Atfal Risdianto | |||||||||
Date Deposited: | 09 Aug 2021 21:30 | |||||||||
Last Modified: | 18 Apr 2023 09:25 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/29766 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |