Nuha, Ahmad Sirojun (2021) Implementation of The Cosine Similarity Method using Thesaurus in The Search Application of English Al-Quran Translation. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
Text (Fulltext)
16650093.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) |
Abstract
ABSTRAK
Mengetahui Terjemah Alquran adalah kunci untuk mengungkapkan semua mutiara kebijaksanaan dan ajaran yang terkandung dalam kitab suci Alquran. Tanpa kunci ini, kita tidak dapat mencapai kesempurnaan mutiara makna yang terkandung dalam Alquran. Dengan memahami terjemah Alquran kita akan bisa belajar untuk memahami Tafsir Alquran. Sebagai Muslim, kita tidak hanya harus pandai membacanya tetapi kita juga perlu mempelajari Alquran sehingga kita bisa mendapatkan berkah dari Alquran dengan sempurna. Text Similarity menentukan seberapa dekat dua teks atau dokumen dalam leksikal atau semantik. Salah satu metode Text Similarity adalah Cosine Similarity yang mengukur sudut cosinus antara vektor, yaitu vektor term terjemahan dan vektor term query. Hasil berupa angka antara 0-1, nilai yang lebih tinggi menghasilkan kecocokan dokumen terbaik. Text similarity melihat kesamaan antara 2 dokumen yang mana semakin banyak kata yang sama maka nilai similarity juga tinggi, padahal ada kata yang berbeda akan tetapi memiliki kesamaan dalam makna, maka Text Similarity saja tidak cukup. Oleh karena itu perlu ditambahkan metode untuk mendapatkan persamaan kata (sinonim) apalagi penelitian ini memiliki objek Terjemah Alquran yang begitu kental dengan kemiripan arti kata. Salah satu metode untuk mendapatkannya yaitu dengan Query Expansion (Perluasan Query). Tujuan penelitian ini adalah untuk mengetahui nilai presisi, recall, f-measure dan akurasi penerapan metode Cosine Similarity tanpa menggunakan Query Expansion dan dengan menggunakan Query Expansion. Uji coba yang telah dilakukan memberikan kesimpulan bahwa metode Cosine Similarity memiliki nilai uji evaluasi yang tinggi dalam aplikasi pencarian terjemah Al-Quran Bahasa Inggris yakni dengan nilai presisi sebesar 84,52%, recall sebesar 68,25%, bobot f-measure 72,94% dan akurasi sebesar 98,62%, akan tetapi dengan menggunakan Query Expansion bisa memberikan nilai lebih tinggi, yakni bisa menghasilkan nilai presisi sebesar 91,64%, recall sebesar 88,40%, bobot f-measure 88,89% dan akurasi sebesar 99,37%.
ABSTRACT
Knowing the translation of the Al-Quran is the key to revealing all the pearls of wisdom and teachings contained in the holy Al-Quran. Without this key, we cannot reach the perfection of meaning contained in the Qur'an. By understanding the translation of the Al-Quran we will be able to learn to understand the interpretation of the Al-Quran. As Muslims, we not only have to be good at reading it but we also need to study the Al-Quran so that we can get the blessings of the Quran perfectly. Text Similarity determines how close two texts or documents are in lexical or semantic. One of the Text Similarity methods is Cosine Similarity, which measures the cosine angle between vectors, namely the translation term vector and the query term vector. The result is a number between 0-1, the higher value is the best document match. Text similarity sees the similarity between 2 documents where the more words are the same, the similarity value is also high, even though there are different words but have similarities in meaning, then Text Similarity is not enough. Therefore, it is necessary to add a method to obtain synonyms, especially since this research has the object of translating the Al-Quran which is so near with the similarity of the word meaning. One of the methods to get it is by Query Expansion. The purpose of this study was to determine the value of precision, recall, f-measure and accuracy of the application of the Cosine Similarity method without using Query Expansion and by using Query Expansion. The experiments that have been carried out have concluded that the Cosine Similarity method has a high evaluation test value in the English translation search application, namely with precision value of 84.52%, recall of 68.25%, f-measure weight of 72.94%. and an accuracy of 98.62%, but using Query Expansion can provide a higher value, which can produce precision value of 91.64%, recall of 88.40%, f-measure weight of 88.89% and accuracy of 99.37%.
مستخلص البحث
إن معرفة ترجمة القرآن هي مفتاح الكشف عن كل لآلئ الحكمة والتعاليم الواردة في القرآن الكريم. بدون هذا المفتاح ، لا يمكننا الوصول إلى كمال المعنى الموجود في القرآن. من خلال فهم ترجمة القرآن ، سنتمكن من تعلم فهم تفسير القرآن. كمسلمين ، لا يجب أن نكون جيدين في قراءته فحسب ، بل نحتاج أيضًا إلى دراسة القرآن حتى نتمكن من الحصول على بركات القرآن الكاملة . يحدد تشابه النص مدى قرب نصين أو وثيقتين في المعجم أو الدلالات. إحدى طرق تشابه النص هي كوسين سملارتي ، والتي تقيس زاويةكوسين بين المتجهات ، أي متجه مصطلح الترجمة ومتجه مصطلح الاستعلام. والنتيجة هي رقم بين 0-1 ، وكلما زادت القيمة أفضل تطابق وثيقة. يرى تشابه النص التشابه بين وثيقتين حيث كلما كانت الكلمات متشابهة ، تكون قيمة التشابه عالية أيضًا ، بالرغم من وجود كلمات مختلفة ولكن لها أوجه تشابه في المعنى ، فإن تشابه النص ليس كافيًا. لذلك لا بد من إضافة طريقة للحصول على المرادفات ، خاصة وأن الهدف من هذا البحث هو ترجمة مصحف كثيف مع تشابه معاني الكلمة. إحدى طرق الحصول عليها هي من توسيع الاستعلام (Query Expansion). كان الغرض من هذه الدراسة هو تحديد قيمة الدقة والاسترجاع والقياس والدقة لتطبيق طريقة كوسين سملارتي بدون استخدام توسيع الاستعلام وباستخدام توسيع الاستعلام. نتجت التجربة التي تم إجراؤها أن طريقة كوسين سملارتي لها قيمة اختبار تقييم عالية في تطبيق بحث الترجمة الإنجليزية ، وهي precision تبلغ 84.52٪ ، recall 68.25٪ ، f-measure 72و49 ٪. accuracy تبلغ 98.62٪ ، ولكن استخدام توسيع الاستعلام يمكن أن يوفر قيمة أعلى الذي يمكن أن ينتج قيمة precision تبلغ 91.64٪ ، recall 88.40٪ ،f-measure 88,89٪ accuracy 99.37٪.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Suhartono, Suhartono and Syauqi, A’la | |||||||||
Contributors: |
|
|||||||||
Keywords: | Pencarian Terjemah Alquran; Cosine Similarity; Query Expansion; Al-Quran Translation Search; Cosine Similarity; Query Expansion | |||||||||
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0802 Computation Theory and Mathematics > 080201 Analysis of Algorithms and Complexity | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Ahmad Sirojun Nuha | |||||||||
Date Deposited: | 22 Jun 2021 10:38 | |||||||||
Last Modified: | 22 Jun 2021 10:38 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/24644 |
Downloads
Downloads per month over past year
Actions (login required)
View Item |