Responsive Banner

Penerapan logistic regression untuk analisis sentimen pada ulasan produk skincare di e-commerce

Naurah, Jinan (2025) Penerapan logistic regression untuk analisis sentimen pada ulasan produk skincare di e-commerce. Undergraduate thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img] Text (Fulltext)
210605110136.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(1MB)

Abstract

INDONESIA:

Penelitian ini bertujuan untuk menerapkan metode TF-IDF dan Logistic Regression dalam mengklasifikasikan sentimen ulasan produk Skincare pada platform E-Commerce. Dataset yang digunakan merupakan dataset publik berbahasa Indonesia berisi tiga kategori sentimen, yaitu positif, netral, dan negatif. Tahapan penelitian meliputi pemuatan dataset, representasi teks menggunakan TF-IDF, pembagian data latih dan uji, serta pelatihan model Logistic Regression pada empat skenario pengujian dengan variasi parameter regularisasi (C = 1 dan C = 10) dan rasio pembagian data (80:20 dan 70:30). Hasil evaluasi menunjukkan bahwa seluruh skenario menghasilkan performa yang tinggi dengan nilai akurasi, precision, recall, dan F1-score (macro) berada di atas 90%. Model terbaik diperoleh pada skenario C10_80_20, yaitu Logistic Regression dengan parameter C = 10 dan rasio pembagian 80:20, yang mencapai akurasi tertinggi di antara seluruh skenario. Temuan ini menunjukkan bahwa kombinasi TF-IDF dan Logistic Regression mampu menghasilkan klasifikasi sentimen yang efektif dan dapat dijadikan dasar untuk pengembangan sistem analisis sentimen pada domain E-Commerce.

ENGLISH:

This research aims to implement TF-IDF and Logistic Regression for classifying sentiment in Skincare product reviews on E-Commerce platforms. The study employs a public Indonesian-language dataset containing three sentiment categories: positive, neutral, and negative. The methodology includes dataset loading, text representation using TF-IDF, data splitting, and model training across four testing scenarios with variations in regularization parameter (C = 1 and C = 10) and data split ratios (80:20 and 70:30). The evaluation results indicate that all scenarios achieve high performance, with accuracy, precision, recall, and macro F1-score values exceeding 90%. The best-performing model is obtained in the C10_80_20 scenario, where Logistic Regression with C = 10 and an 80:20 train-test ratio achieves the highest accuracy among all configurations. These findings demonstrate that the combination of TF-IDF and Logistic Regression is effective for sentiment classification and can serve as a foundation for developing sentiment analysis systems in the E-Commerce domain.

ARABIC:

يهدف هذا البحث إلى تطبيق طريقة TF-IDF والانحدار اللوجستي في تصنيف مشاعر مراجعات منتجة العناية بالبشرة على منصات التجارة الإلكترونية. مجموعة البيانات المستخدمة هي مجموعة بيانات عامة باللغة الإندونيسية وتحتوي على ثلاث فئات من المشاعر، وهي الإيجابية، والمحايدة، والسلبية. تشمل مراحل البحث تحميل مجموعة البيانات، وتمثيل النص باستخدام TF-IDF، وتقسيم البيانات إلى بيانات تدريب واختبار، وتدريب نموذج الانحدار اللوجستي على أربعة سيناريوهات اختبار مع اختلافات في معامل التنظيم (ج=1 و ج=10) ونسبة تقسيم البيانات (80:20 و 70:30). أظهرت نتائج التقييم أن جميع السيناريوهات قدمت أداءً عاليًا مع قيمة الدقة، والضبط، والاستدعاء، وقيمة ف1 (الإجمالي) أعلى من 90%. تم الحصول على أفضل نموذج في سيناريو C10_80_20، وهو الانحدار اللوجستي بمعامل ج=10 مع نسبة تقسيم 80:20، والذي حقق أعلى دقة بين جميع السيناريوهات. أشارت هذه النتائج إلى أن الجمع بين TF-IDF والانحدار اللوجستي قادر على إنتاج تصنيف فعال للمشاعر ويمكن أن يكون أساسًا لتطوير نظام تحليل المشاعر في مجال التجارة الإلكترونية

Item Type: Thesis (Undergraduate)
Supervisor: Faisal, Muhammad and Kusumawati, Ririen
Keywords: Analisis Sentimen; TF-IDF; Logistic Regression; Ulasan Skincare; Machine Learning; Sentiment Analysis; TF-IDF; Logistic Regression; Skincare Reviews; Machine Learning; تحليل مشاعر; TF-IDF;انحدار لوجستي ;مراجعات عناية ببشرة تعلم آلي
Subjects: 08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080107 Natural Language Processing
08 INFORMATION AND COMPUTING SCIENCES > 0801 Artificial Intelligence and Image Processing > 080109 Pattern Recognition and Data Mining
Departement: Fakultas Sains dan Teknologi > Jurusan Teknik Informatika
Depositing User: Jinan Naurah
Date Deposited: 24 Dec 2025 09:08
Last Modified: 24 Dec 2025 09:08
URI: http://etheses.uin-malang.ac.id/id/eprint/82094

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item