الرياضيات > رياضيات في دقيقة
الإحصاء ودرجات الحرية
لماذا عند حساب التباين (Variance) ومنه الانحراف المعياري (Standard Deviation) لعينة (Sample) نقسم المقام -أي مجموع الانحرافات المربعة (Sum of Squared Deviations)- على n-1 وليس على عددها n؟
ظهر مفهوم درجات الحرية (degrees of freedom) في الإحصاء بسبب حاجتنا إلى تقدير خاصية إحصائية مجهولة للمجتمع (Population) كاملًا بناءً على بيانات عناصر عينة ما، أي بسبب التعميم من عينة إلى مجتمع في الإحصاء الاستدلالي أو الاستنتاجي (Inferential Statistics)، إذ تلعب مقاييس التشتت كالانحراف المعياري دورًا حيويًّا فيها. وتعتمد كفاءة هذه التعميمات على التقدير الدقيق للاختلاف -غير المعروف في العادة- بين أعضاء المجتمع؛ أي تشتتهم عن الوسط الحسابي له. عادةً، ليس لكل مشاهدات العينة -المستخدمة لتقدير ما جُهل عن المجتمع- الحرية في الاختلاف بسبب بعض القيود الرياضية (1). مثال للتوضيح: تخيل أن 30 شخصًا يودون الجلوس على 30 مقعدًا، سيكون لدى 29 شخصًا الحرية لاختيار مكان جلوسهم، لكن الشخص الأخير لا يمكنه الجلوس إلا على المقعد الأخير المتبقي، بنفس المنطق لو حسبت الوسط الحسابي لعينة تتكون من ثلاثين عددًا، فسيكون لتسعة وعشرين عددًا الحرية للاختلاف، لكن العدد الثلاثين سَيُحدد بالقيمة اللازمة للوصول إلى هذا الوسط الحسابي (2). وعند حساب الانحراف المعياري نحتاج إلى حساب الانحرافات عن الوسط الحسابي، والوسط الحسابي هو نقطة الاتزان بين المشاهدات الأقل والأكثر منه؛ أي نقطة الاتزان التي تساوي بين مجموع الانحرافات السالبة والموجبة عن الوسط الحسابي؛ أي رياضيًّا: مجموع الانحرافات عن الوسط الحسابي يساوي الصفر. لنفترض أنك تريد استخدام الاختلاف بين مشاهدات عينة عشوائية هي (7، 3، 1، 0، 4) لحساب التشتت أو الاختلاف في مجتمع ما. الوسط الحسابي لهذه المشاهدات هو 3، ومجموع الانحرافات عن هذا الوسط هو صفر:
لو أخذت الانحرافات للمشاهدات الأربع الأولى، فسيكون المجموع كالتالي:
لن يكون للقيمة الأخيرة لهذه العينة الحرية في انحرافها عن وسطها الحسابي؛ إذ ستتحدد قيمة هذا الانحراف بسبب القيد الرياضي على مجموع الانحرافات عن وسطها الحسابي بكونه صفرًا دائمًا. تبعًا لذلك فإن الانحراف الأخير يساوي 1 إذ إن (1):
وعلى نحو عام فإن درجات الحرية هي عدد القيم التي لها حرية الاختلاف عند وجود قيد رياضي واحد أو أكثر في عينة تستخدم لتقدير معلمة أو خاصية لمجتمع ما (1-3). بينما لو كان الوسط الحسابي للمجتمع معروفًا؛ مثلًا يساوي 2، فإن مجموع الانحرافات لمشاهدات العينة التي استخدمناها عن الوسط الحسابي للمجتمع وليس للعينة لا يساوي صفرًا بل 5:
أي ليس هناك أي قيد رياضي على انحراف هذه القيم، بل للقيم الخمسة الحرية في الاختلاف والتشتت، أي درجات الحرية تساوي خمسة، لأن كل قيمة تقدم معلومات مفيدة عن الاختلاف والتشتت بين عناصر المجتمع.
تلخيصًا لما تقدم: عند استخدام n من العناصر أو الانحرافات حول الوسط الحسابي للعينة لتقدير الاختلاف بين عناصر المجتمع فإن (n-1) من العناصر لها حرية الاختلاف، أي إن درجات الحرية تساوي (n-1)
(1,3). لذلك، فعند حساب التباين لعينة ما باستخدام وسطها الحسابي لتقدير التباين للمجتمع سيكون أكثر دقة أن يكون المقام معبرًا عن عدد الانحرافات المستقلة، أي درجات الحرية التي تساوي n-1، حيث n عدد عناصر العينة (1).
المصادر:
2. Statistics Online Support[Internet]. Austin: The University of Texas. Degrees of Freedom [cited 2022 Aug 31]. Available from: هنا.
3. Eisenhauer J G. Degrees of Freedom in Statistical Inference. In: Lovric M. International Encyclopedia of Statistical Science [internet]. Berlin, Heidelberg: Springer; 2011[cited 2022 Aug 31]. p 365–367. Available from: هنا