الأخطاء الشائعة فی إجراءات التحقق من ثبات وصدق أدوات القیاس المستخدمة فی البحوث التربویة العربیة
إعـــــــــداد
د/ سومیة شکری محمد محمود
مدرس بقسم علم النفس التربوی
کلیة التربیة بجامعة المنیا (مصر)، وجامعة الإمام عبد الرحمن بن فیصل (السعودیة)
} المجلد الخامس والثلاثون– العدد السابع – یولیو 2019م {
الملخص:هدفت الدراسة الحالیة إلى تحدید الأخطاء الشائعة فی إجراءات التحقق من ثبات وصدق أدوات القیاس المستخدمة فی البحوث التربویة العربیة، حیث تم حصر طرق حساب ثبات وصدق أدوات القیاس المستخدمة فی عینة من 72 بحثاً منشوراً فی مجلة الجامعة الإسلامیة للدراسات التربویة والنفسیة، خلال عام 2012 وعام2016، وبلغ عدد أدوات القیاس المستخدمة فی هذه البحوث 92 أداة، کان 85% منها من إعداد الباحثین، وقد تم رصد 12 خطأً متکرراً فی إجراءات التحقق من الثبات، و9 أخطاء متکررة فی إجراءات حساب الصدق، کما اعتمد الباحثون بشکل أساسی على طریقة الاتساق الداخلی لحساب ثبات أدوات القیاس، فبلغ مجموع نسبة استخدام التجزئة النصفیة أو معادلة ألفا أو کیودر ریتشاردسون منفردة أو مع طرق أخرى 87% تقریباً، وبلغت نسبة استخدام طریقة إعادة التطبیق منفردة أو مع طرق أخرى 32%، کما کانت طریقة الصدق المرتبط بالمحتوى هی الأکثر استخداماً، إذ بلغت نسبة استخدامها منفردة أو مع طرق أخرى 77%، دون الاعتماد على أی طریقة کمیة للتقدیر، کما استُخدمت طریقة الاتساق الداخلی کطریقة لحساب الصدق فی أکثر من نصف البحوث، حیث بلغت نسبة استخدام هذه الطریقة منفردة أو مع طرق أخرى 52%، وقد وضَّحت الدراسة الفرق بین استخدام طریقة الاتساق الداخلی لحساب الصدق، واستخدامها لحساب الثبات. وأوصت الدراسة بإعداد مقیاس علمی لتقدیر دقة إجراءات التحقق من صدق وثبات أدوات القیاس فی البحوث التربویة.الکلمات المفتاحیة: الثبات - ثبات الاتساق الداخلی - الصدق – صدق التکوین الفرضی. Abstract:This study aimed at identifying the Common mistakes in reliability and validity procedures of the measuring tools used in the Arabic educational research. The procedures of reliability and validity of the measuring tools used in a sample of 72 papers published in 2012 and 2016 in the Journal of the Islamic University for Educational and Psychological Studies were evaluated. The number of measuring tools used in these researches was 92 tools 85% were created by the researchers. Twelve frequent mistakes were detected in reliability procedures and nine repeated mistakes were detected in validity procedures. The most frequent method of reliability was the internal consistency including split-half method, Alpha coefficient and Kudar –Richardson. The most frequent method of validity was the content related validity with the percentage of use alone or with other methods 77% without applying any quantitative method of estimation the content validity index. More than half of the researches used the method of "internal consistency" as a method of measuring validity. The study clarified the difference between using the "internal consistency" method to detect validity and using it to detect reliability. The study recommended creating an analytical rubric to assess the accuracy of reliability and validity procedures.Key words: Reliability - Internal consistency – Validity - construct validity. مقدمة:یمثل البحث التربوی وسیلة مهمة للنهوض بالمجتمعات؛ إذ یُسهم فی حل المشکلات المتعلقة بتربیة الإنسان وبنائه، وفی ضوء نتائجه یتم اتخاذ القرارات التی تؤثر فی عملیة التعلیم والتعلم. وتتوقف دقة نتائج البحوث التربویة على عدة عوامل، منها التحقق من ثبات وصدق أدوات القیاس المستخدمة، والمطلع على البحوث التربویة والنفسیة یجد أن معظم الباحثین یفضلون إعداد أدوات قیاس خاصة ببحثهم، بغض النظر عن مدى توفر هذه الأدوات فی الأدب النفسی والتربوی، وذلک نتیجة الاعتقاد السائد بأن قیام الباحث بإعداد أدواته الخاصة یدلل على مهاراته البحثیة، مع عدم الوعی الحقیقی بصعوبة الوصول إلى المقاییس ذات المستوى المقبول من الصدق والثبات، التی یتطلب إعدادها فریقاً مدرَّباً من الباحثین المتخصصین، وعینات کبیرة من المفحوصین، کما یتطلب جمع عدة أدلة للتحقق من ثباتها وصدقها.مما یثیر التساؤل حول مدى دقة الإجراءات التی یتبعها الباحثون للتحقق من صدق وثبات أدوات القیاس المستخدمة فی البحوث التربویة، فاستخدام أدوات غیر مناسبة یؤدی إلى جمع بیانات خاطئة مما یقود إلى نتائج مضللة، وقد أشار عزت (2016: 8-9) إلى أن هناک العدید من الأخطاء التی یقع فیها الباحثون والمناقشون تتعلق بالخصائص السیکومتریة لأدوات البحث. وأشار باهی (2011: 1406) إلى أن هناک أخطاء کثیرة فی استخدام المصطلحات العلمیة الخاصة بکل من الثبات والصدق، حیث تم استنساخ العدید من المصطلحات التی لا أساس لها من الصحة، مما یبرز الحاجة إلى محاولة وصف هذه الحالات، وتحدید مدى انتشارها، وهل تمثل ظاهرة تتطلب المواجهة أم أنها مجرد حالات فردیة؟. مشکلة الدراسة:هناک مجموعة من طرق حساب ثبات أدوات القیاس وصدقها، محددة ومعروفة فی الأدب السیکومتری، وبمطالعة البحوث التربویة العربیة المنشورة فی الدوریات العلمیة المحکمة، نجد أن هناک خلطاً لدى العدید من الباحثین بین مفهوم الثبات والصدق، فنجدهم یخلطون بین إجراءات التحقق من ثبات الاتساق الداخلی وإجراءات التحقق من صدق التکوین الفرضی لأدوات القیاس المستخدمة فی البحث، کما أن هناک أخطاء متعلقة بدقة إجراءات تقدیر کل من صدق المحتوى والصدق التمییزی، وکذلک هناک ندرة فی البحوث التی تعتمد على مقاییس مقنَّنة، فالجمیع - بغض النظر عن تخصصه - یقوم بإعداد أدوات قیاس خاصة ببحثه. وهکذا تتعدد الأخطاء فی بحوثنا التربویة، مما یلفت الانتباه إلى رصد حجمها، وهل هی أخطاء نادرة أم أنها تمثل ظاهرة تتطلب المواجهة والعلاج؟ وبناءً على ما سبق یمکن صیاغة مشکلة الدراسة فی التساؤلات التالیة:[list="box-sizing: border-box; margin-bottom: 20px; color: rgb(51, 51, 51); font-family: rtl-font, Arial, Helvetica, sans-serif; font-size: 14px; background-color: rgb(255, 255, 255);"][*]ما الطرق الأکثر استخداماً للتحقق من ثبات أدوات القیاس فی البحوث التربویة؟
[*]ما الطرق الأکثر استخداماً للتحقق من صدق أدوات القیاس فی البحوث التربویة؟
[*]ما نسبة البحوث التی تعتمد على أدوات قیاس مقنَّنة أو منشورة؟
[*]ما الأخطاء الشائعة فی إجراءات حساب ثبات أدوات القیاس فی البحوث التربویة؟
[*]ما الأخطاء الشائعة فی إجراءات التحقق من صدق أدوات القیاس فی البحوث التربویة؟
[/list]
أهداف الدراسة:[list="box-sizing: border-box; margin-bottom: 20px; color: rgb(51, 51, 51); font-family: rtl-font, Arial, Helvetica, sans-serif; font-size: 14px; background-color: rgb(255, 255, 255);"][*]تحدید وتصنیف الأخطاء الشائعة فی إجراءات حساب ثبات وصدق أدوات القیاس فی البحوث التربویة.
[*]تحدید نسبة الأخطاء الشائعة فی إجراءات حساب ثبات وصدق أدوات القیاس فی البحوث التربویة.
[*]مناقشة المفاهیم المرتبطة بطرق حساب ثبات وصدق أدوات القیاس فی البحث التربوی، والتی تتداخل لدى طلاب الدراسات العلیا والباحثین.
[/list]
أهمیة الدراسة:الأهمیة النظریة:تناقش الدراسة بعض المفاهیم المهمة فی القیاس النفسی والتربوی، وبخاصة تلک المتعلقة بثبات الاتساق الداخلی وصدق التکوین الفرضی، وهما مفهومان کثیراً ما یحدث بینهما تداخل وخلط لدى العدید من طلاب الدراسات العلیا والباحثین.الأهمیة التطبیقیة:[list="box-sizing: border-box; margin-bottom: 20px; color: rgb(51, 51, 51); font-family: rtl-font, Arial, Helvetica, sans-serif; font-size: 14px; background-color: rgb(255, 255, 255);"][*]تُسهم الدراسة فی تحسین جودة البحث التربوی العربی من خلال تحسین مستوى ثبات وصدق أدوات القیاس المستخدمة فیه.
[*]تُسهم الدراسة فی زیادة وعی الباحثین بالإجراءات الدقیقة لحساب ثبات وصدق أدوات القیاس، والتی یتوقف علیها الثقة فی نتائج البحوث.
[/list]
حدود الدراسة:الحد الموضوعی: تتحدد نتائج الدراسة بطرق حساب ثبات وصدق أدوات القیاس فی ضوء النظریة الکلاسیکیة فی القیاس.الحد المکانی والزمانی: تتحدد نتائج الدراسة بالمجلة المختصة التی تم اختیار عینة البحوث منها، وهی مجلة الجامعة الإسلامیة للدراسات التربویة والنفسیة، خلال عامی: 2012م، 2016م.التعریف الإجرائی لمتغیرات الدراسة:[list="box-sizing: border-box; margin-bottom: 20px; color: rgb(51, 51, 51); font-family: rtl-font, Arial, Helvetica, sans-serif; font-size: 14px; background-color: rgb(255, 255, 255);"][*]ثبات أداة القیاس: یُقصد به ثبات درجات أداة القیاس، أی: مدى خلو تباین درجات عینة محددة من المفحوصین علیها من تباین الخطأ العشوائی.
[*]صدق أداة القیاس: هو صفة فریدة unitary لا تتعلق بالأداة فی حد ذاتها، وإنما تتعلق بتفسیر الدرجات المستمدة منها، وتعنی مدى صحة القرارات التی یتم اتخاذها فی ضوء نتائج الأداة.
[/list]
الإطار النظری والدراسات السابقة: یُعرف البحث التربوی بأنه تطبیق المنهج العلمی فی دراسة المشکلات التربویة، ومن ثم فهناک مجموعة من المعاییر والإجراءات التی یحددها المنهج العلمی حتى یحقق البحث التربوی الهدف منه (Oluwataya, 2012: 391)، وتتنوع أدوات جمع المعلومات فی البحث التربوی بتنوع أهدافه، فمنها الاختبارات والمقاییس النفسیة، واختبارات التحصیل، والاستبانة، والمقابلة، والملاحظة، واستمارة تحلیل المحتوى، وأیاً کانت الأداة التی یستخدمها الباحث فعلیه أن یتحقق من معاییر بنائها وصلاحیتها، ومن أهم هذه المعاییر ثبات الأداة وصدقها (عطیة، 2009: 107-108، أبو علام، 2006: 447)؛ وذلک لضمان صحة ودقة البیانات التی یتم جمعها، فالقصور فی التحقق من ثبات وصدق الأدوات یؤدی إلى جمع بیانات خاطئة، ومن ثم الوصول إلى نتائج مضللة. وقد بینت دراسة (Fong, 1994) أن العدید من البحوث التی أجریت فی مجال التربیة وعلم النفس تفتقد الواقعیة، ویصعب تعمیم نتائجها، وتقود إلى نتائج مضللة؛ بسبب الأخطاء المنهجیة فی تصمیمها وإجراءاتها، وتکمن خطورة ذلک فی طبیعة المشکلات التی یتناولها البحث التربوی، الذی یُعنَى بالإنسان بالدرجة الأولى، سواء أکان معلماً أم متعلماً، فقد تؤدی النتائج المضللة إلى توجیه العملیة التربویة والتعلیمیة فی اتجاهات خاطئة، لذا بات من الضروری التحقق من دقة إجراءات ثبات وصدق أدوات القیاس المستخدمة فی البحوث التربوی؛ لما له من دور فی تحسین جودة هذه البحوث وزیادة الثقة فی نتائجها.ویشیر مفهوم الثبات إلى مدى اتساق نتائج المقیاس، أی: مدى إمکانیة الحصول على نفس النتائج إذا قمنا بتطبیق المقیاس نفسه عدة مرات على نفس المفحوصین (أبو علام، 2006: 448، میخائیل، 2015: 95)، ویقابله مفهوم الدقة Precise (عبیدات، 2010: 330).ویُعرف ثبات المقیاس إحصائیاً بأنه نسبة تباین الدرجات الحقیقیة إلى تباین الدرجات الملاحظة، حیث یتضمن تباین الدرجات الملاحظة فی القیاس النفسی عادة مقداراً من تباین الخطأ، وتتعدد مصادر أخطاء القیاس، فمنها ما یتعلق بالمقیاس نفسه، کالخطأ فی أسلوب معاینة الفقرات للنطاق السلوکی المستهدف بالقیاس، ومنها ما یتعلق بإجراءات التطبیق والتصحیح، کالأخطاء فی تعلیمات الاختبار الشفهیة، أو أخطاء الطباعة، أو عدم مناسبة البیئة الفیزیائیة أو النفسیة للتطبیق، ومنها مصادر تتعلق بالمختبرین، کمیلهم للتخمین أو الغش، بالإضافة لتأثیر المرغوبیة الاجتماعیة على استجاباتهم (علام، 2011: 131-143).وتشیر أدبیات القیاس والتقویم التربوی إلى طرق متعددة لتقدیر قیم معامل الثبات، کإعادة التطبیق، والصور المتکافئة، وإعادة التطبیق بصور متکافئة، والاتساق الداخلی، وثبات تقدیرات المحکمین. ولکل طریقة مجموعة من الإجراءات والضوابط یضیق المقام بسردها هنا، والذی ینبغی الترکیز علیه أن هذه الطرق تختلف باختلاف مصدر الأخطاء العشوائیة التی نود تقدیر تأثیرها فی الدرجات الملاحظة، وهذا یعتمد على طبیعة الاختبار، وفیم تستخدم درجاته؟، لذلک لابد أن یکون هناک مبرر منطقی لاختیار طریقة حساب الثبات، بالإضافة لضرورة الالتزام بالإجراءات العلمیة لاستخدام الطریقة المختارة (أبو علام، 2006: 468، علام، 2011: 144-168، أبو دنیا، 2018: 252-257، ملحم، 2018: 302-313).أما الصدق فیُعد أهم خاصیة من خصائص القیاس، ویشیر إلى صحة الاستدلالات التی نتوصل إلیها من درجات المقاییس، من حیث فائدتها ومعناها (أبو علام، 2006: 447)، ویکون المقیاس صادقاً عندما یقیس ما أُعد لقیاسه، ویقابله مفهوم الصحة Accurrate (عودة، 2010: 330)، فهو یعنی مدى تلبیة المقیاس للأغراض والاستعمالات الخاصة التی صُمم من أجلها. ویُعد الصدق صفة نسبیة؛ إذ لا یوجد مقیاس صالح فی کل المواقف، إنما یتوقف صدق المقیاس على وظیفته، والغرض منه، فالاختبار الذی یتم إعداده بغرض التنبؤ قد لا یعمل بنفس درجة الصدق فی التشخیص (میخائیل، 2015: 86-87).وعلى الرغم من ظهور مصطلحات عدیدة للتعبیر عن طرق حساب الصدق، والتی أُصطلح على تسمیتها بــ"أنواع الصدق"، فإنه من الواجب هنا التأکید على أنه لا توجد أنواع مختلفة للصدق؛ فالصدق مفهوم مجرد، وفرید، ومتعدد الأبعاد ، لذا تتعدد طرق التحقق منه، ولا تُعد هذه الطرق بدائل لبعضها البعض، لکن کلاً منها یهتم بجمع نوع معین من الأدلة یبرر جانباً من جوانب الصدق المختلفة (AERA, APA & NCME, 2014: 11).وعلى الرغم من التصنیفات العدیدة لطرق حساب الصدق، فإن التصنیف الأکثر شیوعاً فی أدبیات ومراجع القیاس والتقویم العربیة یضعها فی ثلاث فئات رئیسیة، هی:[list="box-sizing: border-box; margin-bottom: 20px; color: rgb(51, 51, 51); font-family: rtl-font, Arial, Helvetica, sans-serif; font-size: 14px; background-color: rgb(255, 255, 255);"][*]ما یرتبط بالمحتوى Content Validity ، ویُقصد به مدى تمثیل فقرات المقیاس تمثیلاً سلیماً للمجال المستهدف بالقیاس، ولذلک فهو یتطلب تحدید هذا المجال تحدیداً واضحاً، وتحدید عناصره، وبناء مجموعة ممثلة من الفقرات، بحیث یتم مقارنة الفقرات بالمواصفات التی تحدد المجال. ولصدق المحتوى بُعدان: الأول هو الصدق الظاهری، الذی یرتبط بمدى وضوح المحتوى بالنسبة للمفحوصین، من حیث: سهولة القراءة، واتساق الأسلوب، والتنسیق، ووضوح اللغة المستخدمة، وإلى أی مدى تبدو الفقرات مرتبطة بهدف الأداة من وجهة نظر المفحوصین. أما البعد الثانی فهو الصدق العینی، الذی یُعنى بتقدیر مدى تمثیل الفقرات للمجال المحدد بجدول المواصفات من وجهة نظر مجموعة من الخبراء.
[*]ما یرتبط بمحک Criterion–Realated Validity ، ویتم من خلال إیجاد معامل الارتباط بین درجات المقیاس ودرجات مقیاس آخر یقیس السمة نفسها وتم التحقق من صدقه، ویُعرف الأخیر بالمحک، وقد یکون المحک أداءً مستقبلیاً للمفحوصین، فحینئذ یُسمی الصدق بالصدق التنبؤی، وقد یتم تطبیق المقیاس المحک بالتزامن مع المقیاس محل الدراسة، وحینئذ یُسمی الصدق بالصدق التلازمی.
[*]ما یرتبط بالبناء أو التکوین Construct Validity ، وتُستخدم هذه الطریقة عندما یتم تصمیم المقیاس فی ضوء نظریة علمیة، أو افتراضات محددة، ویکون الهدف تحدید ما إذا کان المقیاس یمثل النظریة أم لا؟، وتعتمد هذه الطریقة على تحدید مدى الارتباط بین الجوانب التی یقیسها المقیاس وبین النظریة أو الافتراضات. ویُعد صدق البناء مفهوماً شاملاً یتضمن سائر أنواع الصدق، ویتطلب الاستنتاجات المنطقیة والوسائل التجریبیة والإحصائیة. وللکشف عن صدق البناء هناک ثلاث خطوات، أولاها: تعریف الإطار النظری للسمة المستهدفة بالقیاس. وثانیتها: اشتقاق فروض حول نتائج المقیاس فی ضوء الإطار النظری المحدد. وثالثتها: اختبار هذه الفروض منطقیاً أو تجریباً. أما إجراءات التحقق من صدق البناء فتتمثل فی الآتی:
[/list]
أ- دراسة العلاقة بالمقاییس الأخرى، وذلک من خلال دراسة الارتباط بین نتائج المقیاس ونتائج مقاییس أخرى تقیس مکوناً یرتبط نظریاً مع المکون المسهدف بالقیاس، أو بدراسة مدى تمایز نتائج المقیاس محل الدرسة عن نتائج مقیاس آخر یقیس مکوناً لا یرتبط مع المکون المستهدف بالقیاس، أو بإجراء التحلیل العاملی لنتائج المقیاس؛ لتحدید نسبة التباین التی تفسرها العوامل المکونة للمقیاس بالنسبة للتباین الکلی، وفحص محتوى العوامل والاستدلال من خلالها على طبیعة المکون الفرضی.ب- الدراسات التجریبیة، وتتم باختبار تغیر درجات المقیاس عند تقدیم أنواع معینة من المعالجات التجریبیة.ج- مقارنة درجات مجموعات متمایزة فی المکون المستهدف بالقیاس.د- التحلیل الداخلی للاختبار، ویتم من خلال جمع معلومات عن محتوى الاختبار نفسه، والعملیات المستخدمة فی الاستجابة على فقراته، والارتباطات بین فقرات الاختبار، ودراسة تجانس المحتوى، والتأکد من أنه یقیس سمة أحادیة البعد، ولذلک یمکن استخدام معامل ألفا أو کیودر- ریتشاردسون کمؤشر للتجانس أو إحادیة البعد.(أبو علام، 2006: 451-460، عبیدات، 2010: 367-386، علام، 2011: 189–228، میخائیل، 2015: 87-93، ملحم، 2018: 318-321).وهناک العدید من الأسالیب أو المؤشرات الإحصائیة والمنطقیة التی تُستخدم فی الکشف عن صدق البناء، وقد یُستخدم أکثر من مؤشر للمقیاس الواحد؛ نظراً لتعدد الفرضیات التی یفرزها الإطار النظری، ومنها بالإضافة للتحلیل العاملی، مؤشرات الثبات، سواء ثبات الاتساق الداخلی باستخدام التجزئة النصفیة وحساب معامل ألفا أو کیودر- ریتشاردسون، أو ثبات الإعادة للکشف عن ثبات السمة وعلاقته بثبات المقیاس، حیث تُعرف السمة السیکولوجیة بأنها مجموعة من السلوکیات التی تمیل إلى الحدوث معاً، وبالتالی فإن قوة الارتباط بین الفقرات المعدة لقیاس السمة تُعد مؤشراً أولیاً لصدق البناء، وکذلک عندما یکون هناک افتراض بأن السمة المقاسة تتغیر مع مرور الزمن، فإن معامل ثبات التجزئة النصفیة ومعامل ثبات الإعادة یُستخدمان معاً کدلیل على صدق البناء، فإذا کان معامل ثبات التجزئة النصفیة مرتفعاً، وکان معامل ثبات الإعادة منخفضاً، فإن ذلک یعنی بدرجة مقبولة من الثقة أن المقیاس صادق فی قیاس هذه السمة (عبیدات، 2010: 356، 381) ومن ثم یُعد الاتساق الداخلی مؤشراً ضروریاً، لکنه غیر کاف لصدق البناء؛ لأنه یعکس مدى خلو المقیاس من أخطاء المعاینة، فإذا افترضنا سمة أحادیة البعد، فهناک عدد کبیر وغیر محدود من المؤشرات السلوکیة الدالة على هذه السمة، وتمثل الفقرات الموجودة فی المقیاس عینة منها، وعندما نثبت أن هناک تجانساً بین هذه الفقرات، فهذا یدل على أننا لم ندرج فی المقیاس مؤشرات تعبِّر عن سمة أخرى، غیر أن ذلک لا یثبت بأی شکل أن عینة الفقرات کافیة، فقد تکون الفقرات متجانسة، ولکن هناک العدید من المؤشرات الأساسیة الدالة على السمة خارج المقیاس، لذا فالاتساق الداخلی یظل مؤشراً أولیاً یحتاج لمزید من الأدلة لإثبات صدق البناء عندما یکون هناک افتراض بأن السمة المستهدفة بالقیاس سمة أحادیة البعد.وتُعد أحادیة البعد صفة مرغوبة فی القیاس النفسی؛ نظراً لصعوبة تفسیر الدرجة الکلیة على المقاییس متعددة الأبعاد، لذا یتم تحلیل السمة متعددة الأبعاد إلى أبعاد أحادیة؛ لیکون هناک معنى للدرجة على کل بعد، فالقیاس النفسی الجید هو الذی یسمح بتقدیر قدرة واحـدة للممتحن فی کل مرة، ولا یسمح بإسهام مقدرتین فی درجة قیاس واحدة، ففی المسائل اللفظیة فی الریاضیات یجب أن یبحث معـد الفقرات عن طرق بدیلة لتقدیم الفقرات، بحیث لا یستمر الأفراد مرتفعو القدرة اللفظیة متمیزین فی الحل (Sijtsma & Molenaar, 2002: 18-19, Bond & Fox, 2007: 34). ومن الضروری أن یهدف الاختبار إلى قیاس قدرة واحدة عندما تُستعمل الدرجة الکلیة وحدها محکاً للتقییم (Sheng & Wikle, 2007: 900)، وجدیر بالذکر أنه من الصعب أن یتحقق افتراض أحادیة البعد عملیاً بشکـل تـام (Harris & Kolen, 1986: 37, Wainer & Mislevy, 2000: 91)؛ نظراً لتعدد العوامل المعرفیة والشخصیة، وتداخلها مع تلک المتعلقة بإجراءات تطبیق الاختبار، التی دائماً ما تؤثر على الأداء فی الاختبار، أو فی بعض نطاقاته علـى الأقل (Hambleton et al., 1991: 9)، وتلک العوامل تکون غیر معروفة، ویصعب التحکم فیها (Osterlind, 1992: 47)، لذلک فمـن الأفضل اعتبار أحادیة البعد متغیراً متصلاً، وعدم اعتبارها متغیراً ثنائیاً، إما أن یتحقق أو لا (Blais & Laurier, 1995: 88).ومن الجدیر بالذکر أننا عندما نستخدم الاتساق الداخلی کمؤشر أولی على صدق البناء، یجب أن نستخدم معامل ألفا أو معامل کیودر- ریتشاردسون کإحصاءة تعبر عن متوسط معاملات الارتباط بین درجات جمیع الفقرات، حیث یعد الصدق صفة لنتائج المقیاس ککل، فی حین أن الاعتماد على الارتباط بین درجة الفقرة ودرجة البعد - وهو الإجراء السائد فی البحوث التربویة العربیة - یقدم معلومات خاصة بالفقرة، وهو معامل تمییز الفقرة، حیث إن معامل تمییز الفقرة هو معامل الارتباط بین درجة الفقرة والدرجة الکلیة على المقیاس بعد تحریر الدرجة الکلیة من درجة الفقرة (عبیدات، 2010: 279-280، علام، 2011: 280، Jeeva, 2016: 51)، ویُستخدم معامل تمییز الفقرة کموشر لصدقها، ومن ثم یتم اسـتبعاد الفقرات منخفضة التمییز (Thorndike, 1982: 53).ویلاحظ مما سبق أن هناک تداخلاً بین إجراءات طرق التحقق من صدق البناء والطرق الأخرى من الصدق، لذا فقد قدمت معاییر القیاس النفسی - التی أعدتها الجمعیة الأمریکیة لعلم النفس ورابطة البحث التربوی الأمریکیة والمجلس الوطی للقیاس فی التربیة - تصنیفاً لطرق التحقق من صدق المقیاس یعالج هذا التداخل، فأشارت إلى أن هناک خمسة أنواع من الأدلة تدعم جوانب الصدق المختلفة، وهی کالتالی:[list="box-sizing: border-box; margin-bottom: 20px; color: rgb(51, 51, 51); font-family: rtl-font, Arial, Helvetica, sans-serif; font-size: 14px; background-color: rgb(255, 255, 255);"][*]الأدلة القائمة على المحتوى، وتعتمد على التحلیلات المنطقیة، وتقویم الخبراء لمحتوى المقیاس، الذی یتضمن: الفقرات، والمهام، والصیاغة، والإخراج، والحکم على کفایة الفقرات، ووضوحها، والعلاقة بینها وبین السمة المستهدفة بالقیاس، کما یمکن أن تتضمن مراجعة الخبراء فحص التحیز للنوع أو الثقافة أو العمر.
[*]الأدلة القائمة على عملیات الاستجابة، وتعنی تحدید مدى تلاؤم طریقة الاستجابات المطلوبة من المفحوصین مع السمة المستهدفة بالقیاس، وتتضمن ملاحظة المفحوصین أثناء الأداء على المقیاس، وإجراء مقابلات معهم لتحدید أسباب إعطاء إجابات محددة للأسئلة، وکذلک فحص الطرق التی یستخدمها المحکمون أو المصححون لأعطاء الدرجات فی ضوء المحکات المحددة للتقدیر أو التصحیح، من أجل التأکد من أنهم یستخدمون المحک کما هو مخطط له، وأن تقدیراتهم لا تتأثر بأی عوامل خارجیة لیس لها علاقة بالسمة المستهدفة بالقیاس.
[*]أدلة تعتمد على البنیة الداخلیة للمقیاس، وهنا یکون الهدف اختبار مدى اتفاق المکونات الداخلیة للمقیاس مع السمة المعرفة نظریاً، ویتم ذلک باستخدام التحلیل العاملی التوکیدی ودالة الأداء التفاضلی للفقرة Differential item function( DIF) ؛ وذلک لتحدید الفقرات المتحیزة، أی الفقرات التی یتباین احتمال نجاح الأفراد من نفس مستوى القدرة فی الإجابة علیها لأنهم ینتمون إلى مجموعات مختلفة، وهناک العدید من طرق حساب دالة الأداء التفاضلی للفقرة، بعضها یعتمد على النظریة الکلاسیکیة فی القیاس، وبعضها یعتمد على نظریة الاستجابة للفقرة.
[*]الأدلة القائمة على العلاقات مع متغیرات أخرى، وتشمل الصدق المرتبط بمحک، بنوعیه التنبؤی والتلازمی، وکذلک الصدق التقاربی، والصدق التمییزی.
[*]الدلیل القائم على نتائج الاختبار، ویتعلق بالنتائج الإیجابیة والسلبیة المتوقعة لاستخدام المقیاس، فهو یعکس مدى فائدة المقیاس.
[/list]
(Goodwin & Leech, 2003: 183-184)وهناک العدید من التهدیدات التی تواجه جودة البحث التربوی، مثل أخطاء تصمیم البحث، وطرق اختیار العینات، واستخدام الأسالیب الإحصائیة غیر المناسبة، واستخدام أدوات غیر صالحة لجمع البیانات (Oluwatayo, 2012: 398)، ومن ثم فقد اهتم عدد من الباحثین بجودة البحث التربوی، وظهر ذلک من خلال الدراسات التی اهتمت بمراجعة دقة الأسالیب الإحصائیة المستخدمة أو تحدید الأخطاء الشائعة لدى الباحثین.فهدفت دراسة (1996) Baumberger & Bangert إلى مراجعة البحوث التربویة المنشورة فی مجلة صعوبات التعلم Learning disabilities، خلال الفترة من 1989م إلى 1993م ، وتوصلت إلى أن 80% من إجراءات تلک البحوث کانت غیر ملائمة.وهدفت دراسة عفانة (2011) إلى معرفة الأخطاء الشائعة لدى طلبة الدراسات العلیا فی تصمیم البحوث التربویة فی جامعات قطاع غزة، ولتحقیق هذا الهدف تم وضع بطاقة ملاحظة یتم تطبیقها أثناء المناقشات العلمیة؛ لتحدید أهم الأخطاء الشائعة فی الهیاکل الأساسیة للبحث، وتوصلت الدراسة إلى أن هناک ثلاثة أخطاء فی رسائل الماجستیر المقدمة فی الجامعة الإسلامیة تتعلق بتساؤلات البحث، والدراسات السابقة، وعینة البحث، بینما کان هناک أربعة عشر خطأً رئیسیاً فی رسائل الماجستیر فی جامعة الأزهر بغزة، تتعلق بعنوان الرسالة، والمقدمة، والمشکلة، والتساؤلات، وصیاغة الفروض، وأهمیة البحث، وأهدافه، والدراسات السابقة، ومنهجیة البحث، وأدواته، وخطوات البحث، والأسالیب الإحصائیة، والمراجع، والطباعة، بینما کان هناک خمسة أخطاء رئیسیة فی رسائل الماجستیر المقدمة فی جامعة الأقصى بغزة، تتعلق بصیاغة العنوان، وکتابة المقدمة، وصیاغة الفروض، والدراسات السابقة، والأخطاء المطبعیة.وأشار عفانه (2011: 327) إلى أن طلاب الدراسات العلیا بجامعات غزة یجدون صعوبة فی إعداد أدوات البحث، وبخاصة أدوات تحلیل المضمون والمقابلة والملاحظة، کما أن معظم الباحثین الذین یجرون بحوثاً تجریبیة لا یقومون بالتحقق من الخصائص السیکومتریة للأدوات؛ نظراً لعدم توفر العینات.وهدفت دراسة (علی، وعبد الحلیم، وحسن، 3013) إلى تحدید مدى مناسبة الأسالیب الإحصائیة المستخدمة فی حساب کفاءة الأدوات فی بعض الرسائل العلمیة بالأقسام التربویة بکلیة التربیة - جامعة أسیوط، خلال الفترة من 2004م إلى 2009م، فی ضوء مستویات القیاس، ومن أهم نتائج هذه الدراسة ارتفاع نسبة الأسالیب الإحصائیة غیر المناسبة عند حساب الصدق، حیث تراوحت هذه النسبة بین 31% إلى 78.5%، ومن هذه الأخطاء قیام الباحثین عند استخدام أسلوب المقارنة الطرفیة للتحقق من صدق الاختبار بحساب دلالة الفروق بین الأقویاء والضعفاء على الاختبار محل الدراسة، ولیس على المحک. وکان من أهم نتائجها أیضاً ارتفاع نسبة الأسالیب الإحصائیة غیر المناسبة عند حساب الثبات، حیث تراوحت هذه النسبة بین 46% و71%، ومن هذه الأخطاء الخلط بین استخدام معادلة کیودر-ریتشاردسون ومعادلة ألفا، واستخدام طریقة إعادة التطبیق مع اختبارات الذکاء والذاکرة والتحصیل، وعدم الالتزام بشروط الفاصل الزمنی بین التطبیقین.کما أشار ذبیحی وشوبار (2017: 20) إلى الأخطاء الشائعة المتعلقة بالتحقق من الخصائص السیکومتریة للمقاییس، ومنها: الخلط بین الاتساق الداخلی والصدق، وحساب دلالة الفروق بین درجات الربع الأعلى والربع الأدنى على المقیاس نفسه، دون الرجوع إلى محک خارجی فی طریقة المقارنة الطرفیة، وکذلک استخدام طریقة التجزئة النصفیة فی حساب ثبات کل المقاییس دون التحقق من شروط استخدامها.وقد حدد (عزت، 2016: 8-9) الأخطاء التی یقع فیها الباحثون والمناقشون المتعلقة بالخصائص السیکومتریة لأدوات البحث، ومن أبرزها: حساب الصدق قبل حساب الثبات، رغم أن الثبات شرط ضروری للصدق،؛ لأن البدء بحساب الثبات یمثل عملیة فلترة أولیة لأداة القیاس من البنود غیر الثابتة، ثم یأتی الصدق لتنقیة الأداة من العبارات غیر الصادقة، ومن تلک الأخطاء أیضاً استخدام مصطلح "صدق الاتساق الداخلی"، والصواب هو "ثبات الاتساق الداخلی"، ومنها کذلک عدم الاهتمام بتحلیل الفقرات، والاکتفاء بالتحلیل الکلی للمقیاس.وترى الباحثة أن إجراءت التحقق من الخصائص السیکومتریة للمقاییس یجب أن تسیر بتسلسل منطقی، فإذا اهتم الباحث بالتحقق من صدق محتوى الأداة، فهنا یجب أن یبدأ بدراسة صدق المحتوى قبل الثبات، ولا یُعد ذلک کافیاَ لحساب الثبات؛ لأنه لا یمثل صدقاً مطلقاً، لکنه صدق لجانب واحد هو المحتوى؛ إذ إن الصدق مفهوم متعدد الأبعاد، فقد تمثل عینة الفقرات المجال المستهدف بالقیاس تمثیلاً جیداً، ولکن یفشل المقیاس فی تقدیم أی معلومات عن السمة المستهدفة بالقیاس، وذلک عندما لا یستطیع التمییز بین المفحوصین، ثم یأتی دور التحلیل التفصیلی للفقرات، فیتم حساب معاملات صعوبة الفقرات ومعاملات تمییزها، وذلک بهدف استبعاد الفقرات متطرفة الصعوبة، التی تُعد أحد مصادر أخطاء القیاس، حیث تؤدی هذه الفقرات إلى انخفاض التباین، ولا تقدم معلومات عن المفحوصین، فعندما تکون الفقرات سهلة جداً ینجح جمیع المفحوصین فی الإجابة عنها، وعندما تکون الفقرات صعبة جداً یفشل جمیعهم فی الإجابة عنها، فیظهرون کعینة متجانسة (عودة، 2010: 339)، ومن ناحیة أخرى تؤدی الفقرات متطرفة الصعوبة إلى انخفاض دافعیة المفحوصین فی الاستجابة على المقیاس أو قد تسبب شعورهم بالملل، کما أن الفقرات الصعبة تدفع المفحوصین للتخمین فی الاختبارات المعرفیة.وفی التحلیل التفصیلی للمقیاس یتم حساب معاملات تمییز الفقرات؛ بهدف استبعاد الفقرات منخفضة التمییز، التی لا تقدم معلومات عن تباین المفحوصین، وأخیراً یأتی التحلیل الکلی للمقیاس، ویفضَّل البدء بحساب الثبات، فإذا لم یتحقق شرط الثبات یجب التوقف وإعادة مراجعة الجوانب المختلفة للمقیاس، أما إذا تم التحقق من ثبات المقیاس فیمکن الاستمرار وجمع أدلة مختلفة للصدق طبقاً للهدف من المقیاس. ومن ناحیة أخرى فقد لاحظت الباحثة أن جمیع الأبحاث التی حاولت التحقق من صدق المحتوى لم تعتمد على أی أسلوب کمی لمعالجة استجابات الخبراء أو المحکمین، رغم وجود العدید من الأسالیب الکمیة للتحقق من صدق المحتوى، وقد أوردها الضوی (2015) فی دراسة بعنوان استخدام الأسالیب الکمیة فی التحقق من صدق محتوى الاختبار النفسی.