Firmansah, Idris (2024) Penerapan metode content-based filrtering dalam sistem rekomendasi wisata berbasis web. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.
![]() |
Text (Fulltext)
200605110183.pdf - Accepted Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) |
Abstract
INDONESIA:
Penelitian ini bertujuan untuk mengembangkan sistem rekomendasi wisata berbasis content-based filtering untuk kota-kota besar di Indonesia, seperti Jakarta, Yogyakarta, Bandung, Semarang, dan Surabaya. Sistem ini dirancang untuk membantu wisatawan dalam menemukan destinasi yang sesuai dengan preferensi mereka berdasarkan informasi terkait deskripsi tempat, jenis wisata, dan rating pengunjung. Data yang digunakan berasal dari dataset "Indonesia Tourism Destination" yang diunduh melalui platform Kaggle. Dataset ini mencakup berbagai atribut penting seperti nama destinasi, lokasi, kategori wisata, dan ulasan pengunjung. Tahapan penelitian meliputi pra-pemrosesan data, TF-IDF, Cosine Similarity implementasi algoritma content-based filtering, dan evaluasi sistem menggunakan metrik Mean Average Precision (MAP) untuk mengukur tingkat akurasi rekomendasi. Pengujian dilakukan dengan 4 skenario, yaitu berdasarkan deskripsi maksimal 200 kata, maksimal 400 kata, maksimal 600 kata dan deskripsi rendem. Hasil penelitian menunjukkan bahwa sistem yang dikembangkan mampu menghasilkan rekomendasi dengan tingkat akurasi yang baik berdasarkan nilai MAP tertinggi disetiap skenario, untuk skenario ketiga adalah skenario yang mimiliki tingkat akurasi terbaik yaitu mencapai 100%. Skenario ketiga lebih unggul karna varian kata yang luas dan jumlah kata yang optimal, sehingga rekomendasi yang dihasilkan memiliki performa yang terbaik.
ENGLISH:
This research aims to develop a tourism recommendation system based on content-based filtering for big cities in Indonesia, such as Jakarta, Yogyakarta, Bandung, Semarang and Surabaya. This system is designed to help tourists find destinations that suit their preferences based on information related to place descriptions, types of tourism, and visitor ratings. The data used comes from the "Indonesia Tourism Destination" dataset downloaded via the Kaggle platform. This dataset includes various important attributes such as destination name, location, tourist category, and visitor reviews. The research stages include data pre-processing, TF-IDF, Cosine Similarity, implementation of the content-based filtering algorithm, and system evaluation using the Mean Average Precision (MAP) metric to measure the level of recommendation accuracy. Testing was carried out with 4 scenarios, namely based on a maximum description of 200 words, a maximum of 400 words, a maximum of 600 words and a rendem description. The research results show that the system developed is able to produce recommendations with a good level of accuracy based on the highest MAP value in each scenario. The third scenario is the scenario that has the best level of accuracy, namely reaching 100%. The third scenario is superior because of the wide variety of words and the optimal number of words, so that the resulting recommendations have the best performance.
ARABIC:
يهدف هذا البحث إلى تطوير نظام توصيات سياحية يعتمد على التصفية القائمة على المحتوى للمدن الكبرى في إندونيسيا، مثل جاكرتا ويوجياكارتا وباندونج وسيمارانج وسورابايا. تم تصميم هذا النظام لمساعدة السياح في العثور على الوجهات التي تناسب تفضيلاتهم بناءً على المعلومات المتعلقة بأوصاف الأماكن وأنواع السياحة وتقييمات الزوار. تأتي البيانات المستخدمة من مجموعة بيانات "الوجهة السياحية الإندونيسية" التي تم تنزيلها عبر منصة Kaggle. تتضمن مجموعة البيانات هذه العديد من السمات المهمة مثل اسم الوجهة والموقع وفئة السائح وتقييمات الزوار. تتضمن مراحل البحث المعالجة المسبقة للبيانات، وTF-IDF، وتشابه جيب التمام، وتنفيذ خوارزمية التصفية القائمة على المحتوى، وتقييم النظام باستخدام مقياس متوسط الدقة (MAP) لقياس مستوى دقة التوصية. تم إجراء الاختبار باستخدام 4 سيناريوهات، استنادًا إلى الحد الأقصى للوصف الذي يبلغ 200 كلمة، والحد الأقصى 400 كلمة، والحد الأقصى 600 كلمة ووصف الرندم. أظهرت نتائج البحث أن النظام الذي تم تطويره قادر على تقديم توصيات بمستوى جيد من الدقة بناءً على أعلى قيمة MAP في كل سيناريو. أما السيناريو الثالث فهو السيناريو الذي يتمتع بأفضل مستوى من الدقة وهو الوصول إلى 100%. ويتفوق السيناريو الثالث بسبب تنوع الكلمات والعدد الأمثل للكلمات، بحيث تتمتع التوصيات الناتجة بأفضل أداء.
Item Type: | Thesis (Undergraduate) |
---|---|
Supervisor: | Chamidy, Totok and Fatchurrochman, Fatchurrochman |
Keywords: | Sistem rekomendasi; content-based filtering; destinasi wisata indonesia; Mean Average Precission; Recommendation system; content-based filtering; tourist destinations Indonesia; Mean Average Precission; نظام التوصية؛ التصفية على أساس المحتوى؛ الوجهات السياحية الاندونيسية؛ متوسط الدقة؛ |
Departement: | Fakultas Sains dan Teknologi > Jurusan Teknik Informatika |
Depositing User: | Idris Firmansah |
Date Deposited: | 20 Jan 2025 08:51 |
Last Modified: | 20 Jan 2025 08:51 |
URI: | http://etheses.uin-malang.ac.id/id/eprint/71815 |
Downloads
Downloads per month over past year
Actions (login required)
![]() |
View Item |