Fauziyah, Muna (2019) Stemming Bahasa Jawa menggunakan Algoritma Levenshtein dan Analisa Morfologi. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
12650132.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) |
Abstract
INDONESIA:
Bahasa Jawa adalah bahasa daerah yang menjadi ciri khas orang jawa, yang digunakan untuk komunikasi sehari-hari oleh masyarakat Jawa. Di era modern ini penggunaan bahasa Jawa dalam komunikasi sehari-hari mulai tergeser karena mengalami banyak tantangan. Salah satu cara mempertahankan bahasa Jawa adalah dengan cara mempelajari dan mengamalkannya dalam kehidupan sehari-hari. Istilah dalam bahasa Jawa banyak yang mengalami perubahan kata dan makna, karena terdapat banyak imbuhan dalam penyusunan kata Jawa. Aplikasi stemming bahasa Jawa menggunakan algoritma Levenshtein dan analisa morfologi ini bisa menjadi salah satu solusi. Aplikasi ini dikembangkan untuk mencari kata dasar dari suatu kata berimbuhan yang berbahasa Jawa. Algoritma Levenshtein digunakan untuk menentukan kata dasar. Sedangkan irisan himpunan digunakan untuk mencari imbuhan yang melekat pada kata dasar. Analisa morfologi dalam penelitian ini digunakan untuk mencari atau mengetahui afiks (ater-ater, seselan, atau penambang) dari kalimat berimbuhan berbahasa Jawa. Kelebihan dari aplikasi ini adalah pengecekan kamus untuk setiap satu kata yang diinput hanya dilakukan sekali sehingga waktu yang digunakan untuk memproses stem lebih cepat. Proses stemming dimulai dengan memasukkan file berbahasa Jawa kemudian file tersebut akan dirubah menjadi huruf kecil dengan proses case folding. Selanjutnya proses tokenizing untuk memecah file menjadi per kata. Kemudian dilakukan proses stemming menggunakan algoritma Levenshtein dan analisa morfologi. Hasil analisa berdasarkan pengujian menunjukkan tingkat keakuratan mencapai 63.75% dari 2.235 kata. Hasil dari analisa yang telah dilakukan menunjukkan bahwa hasil dari proses stem yang tidak sesuai, sebagian besar dikarenakan kurangnya daftar kata dasar dalam kamus yang digunakan.
ENGLISH:
Javanese language is zone language which is an identity of Javanese people, it is used to communicate with other people every day. In this modern era, the using of Javanese language when doing communication is removed because of many challenges. One of the ways to preserve existence of Javanese Language is by studying and practicing it in the daily activity. Many terms in the Javanese language had changed either the word or meaning, because there are many affixes in the Javanese word forming. Javanese language Stemming application uses Levenshtein algorithm and morphology analysis, it can be one of the solutions. This application is developed in order to find out word root of affixed Javanese words. Levenshtein algorithm is used to determine the word root. Meanwhile, the group-piece is used to determine the affixes which is affixed on the word root. In this research, morphology analysis is used to find out or know the affixes (ater-ater, seselan, or penambang) from the Javanese affixed sentences. The advantages of this application is dictionary checking of every word which is inputted is done only once. So, the time for processing the stem is faster. Stemming process is started with inputting Javanese file. Then, that file will be changed into small letter using case foding process. Moreover, tokenizing process to spread the file into word by word. Then, the researcher does stemming process using Levenshtein algorithm and morphology analysis. Analysis result based on the testing. It shows that accuracy level reaches 63.75 % from 2,235 words. The result of the analysis which had done shows that the stem process is not appropriate, most because of minimalism of words root on the dictionary which is used.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Syauqi, A’la and Hanani, Ajib | |||||||||
Contributors: |
|
|||||||||
Keywords: | bahasa jawa; morfologi; irisan himpunan; javanese language; group-piece; levenshtein; morphology; stemming | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Anisa Putri | |||||||||
Date Deposited: | 30 Mar 2020 09:53 | |||||||||
Last Modified: | 30 Mar 2020 09:53 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/16387 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |