Responsive Banner

Klasifikasi keterampilan kerja menggunakan metode Tf-Idf dan Decision Tree pada data lowongan kerja Linkedin

Ahmed, Mohamud (2025) Klasifikasi keterampilan kerja menggunakan metode Tf-Idf dan Decision Tree pada data lowongan kerja Linkedin. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

[img]
Preview
Text (Fulltext)
210605210007.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

(1MB) | Preview

Abstract

ABSTRAK

Penelitian ini bertujuan untuk menganalisis tren keterampilan kerja di sektor Teknologi Informasi (IT) dengan memanfaatkan data lowongan pekerjaan sintetis yang menyerupai format LinkedIn menggunakan pendekatan text mining. Metode TF-IDF diterapkan untuk mengekstraksi fitur kata kunci penting dari deskripsi pekerjaan yang bersifat tidak terstruktur, sementara algoritma Decision Tree digunakan untuk mengklasifikasikan jenis pekerjaan berdasarkan fitur yang diperoleh. Data yang digunakan meliputi 100 entri lowongan pekerjaan berbahasa campuran Indonesia dan Inggris, dengan proses preprocessing teks yang komprehensif untuk memastikan kualitas data. Hasil penelitian menunjukkan bahwa kombinasi TF-IDF dan Decision Tree efektif dalam mengidentifikasi keterampilan utama dan mengelompokkan jenis pekerjaan secara akurat dan mudah diinterpretasikan. Berdasarkan analisis, kategori pekerjaan Data Engineer menjadi yang paling banyak diminati, dengan kata kunci utama seperti “data”, “experi”, “work”, “team”, dan “product” yang menggambarkan kebutuhan keterampilan teknis dan kolaboratif. Model Decision Tree mencapai akurasi 80,3%, khususnya baik dalam mengklasifikasikan Data Analyst. Visualisasi seperti Word Cloud dan feature importance plot memberikan gambaran intuitif mengenai kebutuhan keterampilan yang dapat dimanfaatkan oleh pencari kerja, penyusun kurikulum, dan perusahaan rekrutmen. Kesimpulannya, penelitian ini membuktikan bahwa penggunaan metode TF-IDF dan Decision Tree mampu mengotomatisasi klasifikasi keterampilan kerja dari data lowongan pekerjaan secara efektif, sehingga mendukung pengambilan keputusan berbasis data dalam dunia ketenagakerjaan di era digital dan revolusi industri 4.0..

مستخلص البحث

تهدف هذه الدراسة إلى تحليل اتجاهات المهارات في قطاع تكنولوجيا المعلومات من خلال استخدام بيانات وظائف صناعية تحاكي تنسيق منصة LinkedIn، وذلك باستخدام نهج تنقيب النصوص. تم تطبيق طريقة TF-IDF لاستخلاص الكلمات المفتاحية المهمة من أوصاف الوظائف غير المهيكلة، في حين استُخدم خوارزم Decision Tree لتصنيف أنواع الوظائف استنادًا إلى الميزات المستخرجة.
يتكون مجموعة البيانات من 100 إعلان وظيفة بلغتين: الإندونيسية والإنجليزية، مع إجراء معالجة نصوص شاملة لضمان جودة البيانات. تشير النتائج إلى أن الجمع بين TF-IDF وخوارزم Decision Tree فعال في تحديد المهارات الأساسية وتصنيف أنواع الوظائف بدقة ووضوح. وبرزت وظيفة مهندس بيانات (Data Engineer) كأكثر الوظائف طلبًا، مع كلمات مفتاحية بارزة مثل "data"، "experi"، "work"، "team"، و"product"، مما يعكس الحاجة إلى المهارات التقنية والقدرة على العمل الجماعي.
حقق نموذج Decision Tree دقة بلغت 80.3%، وكان أداؤه متميزًا خصوصًا في تصنيف وظائف محللي البيانات (Data Analyst). توفر التصورات البيانية مثل سحابة الكلمات ومخططات أهمية الميزات رؤى بديهية حول متطلبات المهارات، مما يعود بالفائدة على الباحثين عن عمل، ومطوري المناهج الدراسية، وشركات التوظيف. وفي الختام، تُظهر هذه الدراسة أن استخدام طريقتي TF-IDF وDecision Tree يمكن أن يساهم بفعالية في أتمتة تصنيف المهارات المطلوبة في سوق العمل من خلال بيانات الوظائف، مما يدعم اتخاذ قرارات قائمة على البيانات في ظل التحول الرقمي وثورة الصناعة 4.0.

ABSTRACT

This study aims to analyze skill trends in the Information Technology (IT) sector by utilizing synthetic job vacancy data resembling LinkedIn format through a text mining approach. The TF-IDF method was applied to extract important keyword features from unstructured job descriptions, while the Decision Tree algorithm was used to classify job types based on the extracted features.The dataset consists of 100 job listings in mixed Indonesian and English languages, with comprehensive text preprocessing to ensure data quality. The results indicate that the combination of TF-IDF and Decision Tree is effective in identifying key skills and categorizing job types accurately and interpretably. Data Engineer emerged as the most sought-after job category, with dominant keywords such as “data,” “experi,” “work,” “team,” and “product” reflecting the need for both technical and collaborative skills. The Decision Tree model achieved an accuracy of 80.3%, performing particularly well in classifying Data Analyst positions. Visualizations, including Word Cloud and feature importance plots, provide intuitive insights into skill demands that can benefit job seekers, curriculum developers, and recruitment companies. In conclusion, this study demonstrates that employing TF-IDF and Decision Tree methods can effectively automate the classification of job skills from vacancy data, thereby supporting data-driven decision-making in the workforce amidst the digital era and Industry 4.0 revolution

Item Type: Thesis (Masters)
Supervisor: Imamudin, Mochamad and Suhartono, Suhartono
Keywords: TF-IDF, Decision Tree, Keterampilan Kerja, Lowongan Pekerjaan, Text Mining, Industri 4.0; TF-IDF, Decision Tree, Job Skills, Job Vacancies, Text Mining, Industry 4.0; شجرة القرار، مهارات العمل، الوظائف الشاغرة، تنقيب النصوص، الثورة الصناعية الرابعة
Departement: Fakultas Sains dan Teknologi > Jurusan Magister Tehnik Informatika
Depositing User: Mohammad Syahriel Ar
Date Deposited: 11 Jul 2025 11:03
Last Modified: 11 Jul 2025 11:03
URI: http://etheses.uin-malang.ac.id/id/eprint/80071

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item