مقارنة تحليل بنود الأسئلة باستخدام نظرية الاختبار التقليدية ونظرية استجابة البنود لدرس اللغة العربية في المدرسة المتوسطة الإسلامية الحكومية باتو

Jundi, Muhammad (2023) مقارنة تحليل بنود الأسئلة باستخدام نظرية الاختبار التقليدية ونظرية استجابة البنود لدرس اللغة العربية في المدرسة المتوسطة الإسلامية الحكومية باتو. Masters thesis, Universitas Islam Negeri Maulana Malik Ibrahim.

مستخلص البحث

أحد الخطوات المهمة في تطوير الاختبار هو تحليل بنود الأسئلة، والذي يمكن أن يتم إجرائه كيفيا وكميا. استنادًا إلى الدراسة المكتبية، هناك نهجان رئيسيان في تحليل بنود الأسئلة الكمي، وهما نظرية الاختبار التقليدية ونظرية استجابة البنود. عمومًا، في سياق بحوث تعليم اللغة العربية، يعتمد العديد على نظرية الاختبار التقليدية، بينما لا يزال استخدام نظرية استجابة البنود غير متبع على نطاق واسع. تشير الدراسة الميدانية الأولية إلى أنه في عملية تطوير أدوات الاختبار لامتحان اللغة العربية في المدرسة المتوسطة الإسلامية الحكومية باتو، يتم تحليل عناصر الاختبار حاليًا بشكل كيفي ولا يشمل التحليل الكمي. لذلك، استنادًا إلى النتائج المستخلصة من الدراسة المكتبية والدراسة الميدانية الأولية، يهدف الباحث إلى مقارنة وتطبيق النهجين في تحليل بنود الأسئلة اللغة العربية في المدرسة.
النهج المستخدم في هذا البحث هو النهج الوصفي الكمي مع عينة تتألف من 313 شخصًا. تشمل طرق جمع البيانات التوثيق والمقابلة. فيما يتعلق بتحليل البيانات، يتم استخدام نهجين: التحليل بناءً على نظرية الاختبار التقليدية والتحليل بناءً على نظرية استجابة البنود، والتي تتضمن تحليلًا رياضيًا يساعده البرنامج الحاسوبي. تتضمن التطبيقات المستخدمة Microsoft Excel 2013، SPSS v.26، R 4.3.0، وRstudio.
تشمل نتائج البحث ما يلي: 1) يظهر التحليل باستخدام نظرية الاختبار التقليدية أن 84% من بنود الاختبار صحيحة، مع ثبات الأداة مرتفع يبلغ 0.86. ومع ذلك، فيما يتعلق بمستوى الصعوبة، هناك 71% من الأسئلة متوسطة، و23% صعبة، وفقط 6% سهلة. يحتاج التركيز أيضًا على درجة التمييز، حيث أن 47% فقط لديها درجة التمييز عالية. 2) يظهر التحليل باستخدام نظرية استجابة البنود بالنموذج اللوجستي ثلاثي المعاملات أن 76% من الأسئلة تعتبر صحيحة وبتنوع ثبات بين مشاركي بالاختبار. على الرغم من أن افتراض أحادية البعد يتحقق، إلا أن افتراض عدم الترابط المحلي وثبات المعاملة لا تتحقق تمامًا ولكن يمكن التعامل معها من خلال حذف بعض البنود غير المتوافقة. هناك 72% من الأسئلة ذات مستوى الصعوبة جيد، ولكن 46% فقط من الأسئلة لديها درجة التمييز مرضية. و70% من الأسئلة تظهر تخمين زائف جيدًا. يصل عدد البنود المعتبرة جيد جدا وجيد وفقًا لمعايير نظرية استجابة العنصر إلى 70.45%. 3) هناك اختلاف في العملية بين نظرية الاختبار التقليدية ونظرية استجابة البنود، خاصة فيما يتعلق بالتقدير والتصنيف للمعاملات. ومع ذلك، لا يظهر تحديد نقاط الضعف في بنود الأسئلة فرقًا كبيرًا بين النهجين. لذلك، يمكن استخدام توجيه النظريتين لتحليل بنود الأسئلة بشكل أشمل. باستخدام النظرين، تشير نتائج التفسير إلى أن 56% من بنود الاختبار تعتبر جيدة ويمكن إعادة استخدامها في المستقبل.


both qualitatively and quantitatively. Based on the literature review, there are two main quantitative approaches to item analysis: classical test theory and item response theory. Generally, in the context of Arabic language education research, the classical test theory is more commonly applied, while the use of item response theory is not yet widespread. Preliminary field studies indicate that in the process of developing test instruments for Arabic language exams at MTs. N in Batu City, item analysis is currently conducted qualitatively and lacks quantitative analysis. Therefore, based on findings from the literature review and preliminary field studies, the researcher aims to compare and apply both approaches in analyzing Arabic language exam items at MTs. N in Batu City.
The research adopts a quantitative descriptive approach with a sample size of 313 participants. Data collection methods include documentation and interviews. Two data analysis methods are employed: analysis based on classical test theory and analysis based on item response theory, involving mathematical analysis assisted by computer software. The applications used include Microsoft Excel 2013, SPSS v.26, R 4.3.0, and Rstudio.
Research findings include the following: 1) Analysis using classical test theory shows that 84% of the items are valid, with a high instrument reliability coefficient of 0.86. However, in terms of difficulty, 71% of the items are considered moderate, 23% are difficult, and only 6% are easy. Attention is needed for item discrimination, as only 47% have a high discrimination level. 2) Analysis using item response theory with a 3-parameter logistic model indicates that 76% of the items are considered valid with varied reliability among test takers. While the unidimensionality assumption is met, the local independence and invariance of parameters are not fully satisfied but can be addressed by removing some non-compliant items. There are 72% of items with good difficulty, but only 46% have satisfactory discrimination. Meanwhile, 70% of items show good pseudo-guessing. Items classified as very good and good according to item response theory criteria reach 70.45%. 3) Differences in the process between classical test theory and item response theory exist, especially in the estimation and categorization of parameters. However, the identification of item weaknesses does not show significant differences between the two approaches. Therefore, a combination of both theories can be used for a more comprehensive item analysis. Using both theories, the interpretation results indicate that 56% of items are considered good and can be reused in the future.


Salah satu langkah penting dalam pengembangan tes adalah analisis butir soal, yang dapat dilakukan baik secara kualitatif maupun kuantitatif. Berdasarkan studi pustaka, terdapat dua pendekatan utama dalam analisis butir soal secara kuantitatif, yaitu teori tes klasik dan teori respons butir. Umumnya, dalam konteks penelitian pendidikan bahasa Arab, pendekatan yang banyak diterapkan adalah teori tes klasik, sedangkan penggunaan teori respons butir masih belum umum digunakan. Studi lapangan awal menunjukkan bahwa dalam proses pengembangan instrumen tes untuk ujian mata pelajaran bahasa Arab di MTs. N Kota Batu, analisis butir soal baru dilakukan secara kualitatif dan belum melibatkan analisis butir soal secara kuantitatif. Oleh karena itu, berdasarkan temuan dari studi pustaka dan studi lapangan awal ini, peneliti bertujuan untuk membandingkan dan menerapkan kedua pendekatan tersebut dalam menganalisis butir soal ujian bahasa Arab di MTs. N Kota Batu.
Pendekatan yang digunakan dalam penelitian ini adalah kuantitatif deskriptif dengan jumlah sampel yang terdiri dari 313 orang. Metode pengumpulan data yang digunakan adalah dokumentasi dan wawancara. Terkait dengan analisis data, digunakan dua metode: analisis berdasarkan teori ujian klasik dan analisis berdasarkan teori respons butir, yang melibatkan analisis matematis yang dibantu oleh perangkat lunak komputer. Aplikasi-aplikasi yang digunakan adalah Microsoft Excel 2013, SPSS v.26, R 4.3.0, dan Rstudio.
Temuan penelitian meliputi hal-hal berikut: 1) Hasil analisis menggunakan teori tes klasik menunjukkan bahwa 84% dari butir soal valid, dengan koefisien reliabilitas instrumen yang tinggi sebesar 0,86. Namun, pada tingkat kesukaran terdapat 71% soal menengah, 23% sulit, dan hanya 6% soal mudah. Daya pembeda soal juga perlu perhatian, karena hanya 47% yang memiliki tingkat daya pembeda tinggi. 2) Hasil analisis menggunakan teori respons butir dengan model 3 parameter logistik menunjukkan bahwa 76% soal dianggap valid dengan reliabilitas yang bervariasi di antara peserta tes. Meskipun asumsi unidimensi terpenuhi, asumsi independensi dan invariansi parameter tidak sepenuhnya terpenuhi, namun dapat diatasi dengan menghapus beberapa butir yang tidak memenuhi asumsi. Terdapat 72% soal dengan tingkat kesukaran yang baik, tetapi hanya 46% soal yang memiliki daya pembeda yang terkategori baik. Sementara, 70% soal memiliki tebakan semu yang baik. Butir-butir yang dianggap sangat baik dan baik menurut kriteria teori respons butir mencapai 70,45%. 3) Terdapat perbedaan dalam proses antara teori tes klasik dan teori respons butir, terutama pada parameter yang diestimasi dan kategorisasi. Meskipun demikian, identifikasi kelemahan butir soal tidak menunjukkan perbedaan signifikan antara kedua pendekatan tersebut. Oleh karena itu, kombinasi kedua teori dapat digunakan untuk melakukan analisis butir soal secara lebih komprehensif. Dengan menggunakan kedua teori, hasil interpretasi menunjukkan bahwa 56% dari butir soal dianggap baik dan dapat digunakan kembali di masa depan.

Item Type: Thesis (Masters)
Supervisor: Nurhadi, Nurhadi and Qomari, Nur
Keywords: تحليل بنود الأسئلة، نظرية الاختبار التقليدية، نظرية استجابة البنود; Item Test Analysis, Classical Test Theory, Item Respons Theory; Analisis Butir Soal, Teori Tes Klasik, Teori Respons Butir
Departement: Sekolah Pascasarjana > Program Studi Magister Pendidikan Bahasa Arab
Depositing User: Muhammad Jundi
Date Deposited: 04 Jan 2024 11:18
Last Modified: 04 Jan 2024 11:18


