Warsito, Aurellesia (2021) Document retrieval menggunakan Maximum Entropy dan Query Expansion. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
|
Text
SKRIPSI - 17650092.pdf Download (5MB) | Preview |
Abstract
INDONESIA:
Indonesia merupakan negara hukum yang menjalankan kehidupan berbangsa, bernegara serta bermasyarakat berdasarkan peraturan perundang-undangan. Hal ini membuat masyarakat harus memiliki pengetahuan mengenai peraturan di Indonesia agar tidak melakukan pelanggaran hukum yang dapat merugikan banyak pihak. Maka dari itu diperlukan sebuah sarana berupa aplikasi untuk mencari dokumen-dokumen peraturan perundang-undangan yang dapat digunakan oleh banyak pihak menggunakan kata kunci atau query. Dalam penelitian ini aplikasi pencarian dokumen perundang-undangan dibangun menggunakan metode Shannon's entropy dan query expansion. Shannon's entropy digunakan untuk menghitung tingkat kecocokan antara query dari user dengan isi dari setiap dokumen perundang-undangan. Semakin tinggi nilai entropy dari sebuah dokumen maka semakin besar pula tingkat kerelevanan dokumen dengan query. Tujuan dari penelitian ini adalah untuk mengukur perbandingan kinerja metode tersebut tanpa atau dengan menggunakan query expansion dengan cara melakukan uji evaluasi sistem dari aspek recall, precision, f-measure dan accuracy. Hasil penelitian menunjukkan bahwa metode Shannon's entropy tanpa menggunakan query expansion memiliki nilai precision sebesar 41,33%, nilai recall sebesar 41,33%, nilai f-measure sebesar 41,33% dan nilai accuracy sebesar 99,41% dalam mengembalikan dokumen sejumlah 10 teratas terhadap masing-masing query. Sedangkan metode Shannon‟s entropy dengan menggunakan query expansion menghasilkan nilai precision sebesar 43,67%, nilai recall sebesar 43,67%, nilai f-measure sebesar 43,67% dan nilai accuracy sebesar 99,44%. Nilai precision, recall, dan f-measure meningkat sebesar 2,34% dan nilai accuracy meningkat sebesar 0,3%. Berdasarkan hasil pengujian tersebut, dapat disimpulkan bahwa metode Shannon's entropy menggunakan query expansion memiliki kinerja lebih baik dibanding tanpa menggunakan query expansion.
ENGLISH:
Indonesia is a constitutional state that carries out the life of the nation, state and society based on statutory regulations. This makes the public must have knowledge of regulations in Indonesia so as not to commit violations of the law that can harm many parties. Therefore we need a facility in the form of an application to search for statutory documents that can be used by many parties using keywords or queries. In this study, the statutory document search application was built using Shannon's entropy method and query expansion. Shannon's entropy is used to calculate the match level between a user's query and the content of each statutory document. The higher the entropy value of a document, the greater the relevance of the document to the query. This method is used because it can measure the relevance of the contents of a PDF document with a query from the user based on the probability terms contained in the document. The purpose of this study is to measure the performance comparison of these methods without or by using query expansion by performing a system evaluation test from the aspects of recall, precision, f-measure and accuracy. The results showed that the Shannon's entropy method without using query expansion has a precision value of 41.33%, a recall value of 41.33%, an f-measure value of 41.33% and an accuracy value of 99.41% in returning documents of 10. top of each query. Meanwhile, Shannon's entropy method using query expansion produces a precision value of 43.67%, a recall value of 43.67%, an f-measure value of 43.67% and an accuracy value of 99.44%. The precision, recall, and f-measure values increase by 2.34% and the accuracy value increases by 0.3%. Based on the results of these tests, it can be concluded that Shannon's entropy method using query expansion has better performance than without using query expansion.
ARAB:
إندونيسيا دولة قانونية تمارس حياة الأمة والدولة والمجتمع على أساس القوانين واللوائح. هذا يجعل الجمهور على دراية باللوائح في إندونيسيا حتى لا ينتهك القانون الذي يمكن أن يضر العديد من الأطراف. لذلك نحن بحاجة إلى أداة في شكل تطبيق للبحث عن وثائق التشريع التي يمكن استخدامها من قبل العديد من الأطراف باستخدام الكلمات الرئيسية أو الاستعلامات. في هذه الدراسة ، تم إنشاء تطبيق البحث عن المستندات القانونية باستخدام طريقة شانون الانتروبيا وتوسيع الاستعلام. تُستخدم إنتروبيا شانون لحساب درجة التطابق بين الاستعلام من المستخدم ومحتويات كل مستند قانوني. كلما زادت قيمة الانتروبيا للمستند ، زاد مستوى ملاءمة المستند للاستعلام. تُستخدم هذه الطريقة لأنها يمكن أن تقيس مدى ملاءمة محتويات مستند PDF باستعلام من المستخدم بناءً على شروط الاحتمال الواردة في المستند. الغرض من هذه الدراسة هو قياس مقارنة أداء الطريقة بدون أو باستخدام توسيع الاستعلام عن طريق إجراء اختبار تقييم النظام من جوانب الاسترجاع والدقة والقياس f والدقة. أظهرت النتائج أن طريقة إنتروبيا شانون بدون استخدام توسيع الاستعلام لها قيمة دقة تبلغ 41.33٪ وقيمة استدعاء 41.33٪ وقيمة قياس f 41.33٪ وقيمة دقة 99.41٪ في إرجاع 10 مستندات. أعلى لكل منها استفسار. بينما تنتج طريقة إنتروبيا شانون باستخدام توسيع الاستعلام قيمة دقة تبلغ 43.67٪ وقيمة استدعاء 43.67٪ وقيمة قياس f 43.67٪ وقيمة دقة 99.44٪. زادت قيمة الدقة والاسترجاع والقياس f بنسبة 2.34٪ وزادت قيمة الدقة بنسبة 0.3٪. استنادًا إلى نتائج الاختبار ، يمكن استنتاج أن طريقة الانتروبيا الخاصة بشانون باستخدام توسيع الاستعلام لها أداء أفضل من دون استخدام توسيع الاستعلام.
Item Type: | Thesis (Undergraduate) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
Supervisor: | Crysdian, Cahyo and Santoso, Irwan Budi | |||||||||
Contributors: |
|
|||||||||
Keywords: | Kueri Pengguna; Perluasan Kueri; Entropi Shannon; Peluang Kosakata; Pengembalian Dokumen; User's Query; Query Expansion; Shannon's Entropy; Term Probability; Information Retrieval; استعلام المستخدم ; توسيع الاستعلام ; إنتروبيا شانون ; احتمالية المصطلح ; استرجاع المعلومات | |||||||||
Subjects: | 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing | |||||||||
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika | |||||||||
Depositing User: | Aurellesia Warsito | |||||||||
Date Deposited: | 09 Aug 2021 21:21 | |||||||||
Last Modified: | 09 Aug 2021 21:21 | |||||||||
URI: | http://etheses.uin-malang.ac.id/id/eprint/29763 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |