تعد الاختبارات التحصيلية من أقدم أدوات القياس والتقويم استخداماً في جمع بيانات کمية عن مستوى الطالب في أي مادة من المواد الدراسية. حيث تساعد المعلم على اتخاذ القرارات التعليمية المناسبة والحصول على بيانات ومعلومات عن السمة المقاسة. وغالباً يتم استخدام الاختبارات لتقييم مستوى أداء الطلبة وتحصيلهم ، حيث کان ومازال العمل بها مستمراً لما لها من دور في الکشف عن مدى نجاح مواقف تعليمية مختلفة.
وقد رکز أصحاب الاتجاه المعاصر في القياس والتقويم التربوي والنفسي جهودهم للتوصل إلى أعلى مستويات الدقة والموضوعية في القياس بحيث تتحقق أدق علاقة بين أداة القياس والسمة المراد قياسها (Nunnally,1978) (في ذيب،2011 ).
وتعتبر الاختبارات محکية المرجع من الاتجاهات الحديثة في عملية القياس النفسي والتربوي والتي ترکز على مقارنة اداء الفرد بمحک معين (درجة قطع)، حيث تصنف هذه الاختبارات کل طالب إلى متقن وغير متقن للمهارة أو السمة المقاسة فقط دون الرجوع الى جماعته أو الصف الذي يدرس فيه. ومما أدى إلى ظهور هذا النوع من الاختبارات هو القصور الحاصل في الاختبارات معيارية المرجع حيث "تهتم بالفروق الفردية بين الطلبة دون النظر إلى مدى إتقان الطالب للمهارات والمعلومات المراد قياسها وذلک لتأهيله لبرامج تدريبية وتعليمية جديدة ، وبالتالي فهي لا تساعد على تقويم وتشخيص کل من کفاية الطالب وبعض البرامج التدريبية القائمة على الکفايات بالقدر المطلوب ، أي أنها لا تزود المعلم بمعلومات دقيقة تساعد في اتخاذ القرارات التربوية المناسبة حول مستوى کفاية الطالب والمنهج الدراسي " (سليمان والصالح، 2016).
أدى الى ظهور الاختبارات محکية المرجع هو ظهور التعلم بالإتقان الذي يعتمد في تفسير الدرجة على اکتساب الفرد للسلوک الذي ينتج عن تحقيقه لهدف أو نطاق من المهارات المحددة. فأخذ هذا النوع من الاختبارات اهتمام کبير من علماء القياس مما ادى الى تفاوت في مفهومه لدى الکثيرين، حيث عرفه النبهان (2013: 97) بأنه طريقة للتحقق من اکتساب المتعلم الکفايات أو المهارات الأساسية التي تعبر عن نواتج تعليمية محددة . کما عرفه ثورندايک Thorndaike "بأنه الاختبار الذي يغطي نطاقاً ضيقاً ويستخدم لأجل اتخاذ قرارات التمکن " (سليمان والصالح، 2016) .
إن عملية اتخاذ القرار لإتقان الطالب للمهارة أو السمة تتم بمقارنة أداءه بالنقطة المحددة مسبقاً على متصل التحصيل، وکذلک قرار تصنيف الطلاب إلى متقنين وغير متقنين تعتمد على درجة القطع أو المحک والذي عرفه تراتيرا (Tiratira,2009) بأنه نقطة على متصل يعد عندها الحد الأدنى المقبول الذي يفصل بين التصنيفات الايجابية والسلبية. (في سليمان والصالح،2016).