الرياضيات > الرياضيات

الخداع باسم الإحصاء الرياضيّ

قد لا يمرّ عليكَ يومٌ دون أن تعترضك مقالة ٌأو بحثًٌ يُثبت أو ينفي حقيقةً كنت تعتقد بها. بغضّ النّظر عن الطّريقة العلميّة الّتي اتّبعها مؤلفو المقالة للحصول على بياناتهم، فلابدّ من أنّهم اعتمدوا على بعض الأدوات الإحصائيّة لتعميم نتائجهم على نطاقٍ أوسع. وهنا مكمن الخطر.

نشرت جريدةٌ في نيويورك مقالةً بعنوان " إنّ متوسط دخل خريج جامعة ييل هو 25،111 دولار" قد يبدو هذا الرّقم المتواضع بعصرنا الحاضر هو رقم مبالغ به جداً في الفترة التي كُتب بها ذلك المقال وهو عام 1954.

لك أن تقيس على هذا المعيار الكثير والكثير من المقالات الّتي تعطي انطباعاً أنّ كاتبيه قد تبنَّوا الدّقة العلميّة في الوصول إلى النّتيجة المُقررة.

بدايةً، لن أهتّم بالأمور التّقنية الّتي يُعنى بها الاختصاصيّون لربط السّبب بالنّتيجة، ولكن ما يلفت الانتباه هنا هو كيف يمكن للباحث أن يستخدمَ الإحصاء ليُظهر البيانات الّتي يرغب بها.

لنُعرّف الآن بعض الأدوات الإحصائيّة ليتضح الفهم عندما نبحث في خصائص تلك الأدوات.

المتوسط: وهو مجموع الأعداد مقسوماً على عددها.

الوسيط: هو العدد الّذي يقع في منتصف سلسلة الأعداد المُرَتّبة.

الرُّبيّع الأول: هو العدد الّذي يُنَصِّف النّصف الأصغر من متسلسلة الأعداد المُرَتّبة.

الرُّبيّع الثالث: هو العدد الّذي يُنَصِّف النّصف الأكبر من متسلسلة الأعداد المُرَتّبة.

لما لا نقوم بطرح بعض الأسئلة حول ما يحمله مقال الجريدة " إنّ متوسّط دخل خرّيج جامعة ييل هو 25،111 دولار"؟

يف وصل كاتب المقال لهذا الرّقم الدّقيق، لِمَ لَمْ يَذكر أنّ المتوسّط كان حوالي 25،000 دولار؟ ما هي الطّريقة المُتّبعة للحصول على مثل هذا المتوسّط؟ والسّؤالُ الأهمُّ هل يُعتبر المُتوسّط أفضلَ أداةٍ للتّعبير عن دخل الخرّيجين؟

لقد بحث الكاتب داريل هاف Darrell Huff هذا المثال في أوّل كتابه : كيف تكذب باستخدام الإحصاء "How To Lie with Statistics". وقد أثار شكوكاً أكثرَ حول صحة المقال، فقد سُئل هل أجاب جميعَ الخرّيجين عن هذا الإحصاء؟ هل كذب بعضهم حول دخله كما هي عادة بعض الأشخاص؟ لاشكّ أنّ هذه الأسئلة قد تنسف النّتيجة بشكلٍ كاملٍ. سأفترض أنّ كاتب المقال قد قام بكلِّ ما باستطاعته لكي يتحقق من البيانات الّتي وردته، وأنّه استقصى عدداً كافياً ليصل لنتيجةٍ مناسبةٍ واقعيّةٍ، واعتراضي الشّخصيّ هو عن الأداة الإحصائيّة الّتي قام مُعِدّو المقال بالاعتماد عليها. هل يُعتَبر المتوسّط الحسابيّ هو أفضل دليلٍ عن دخل خرّيجي الجامعة؟.

لتوضيح مأخذي عن استخدام المتوسّط الحسابيّ، سنعرض المثال الرّقميَّ التّالي:

مثال: لتكن المجموعة التّالية هي دخل ١٠ من خرّيجي الجامعة:

إنّ المتوسّط لتلك المجموعة هو: ١٦،٤١٠ ، لنقارن المتوسّط مع دخل الأفراد العشر بأن نذكر الأكبر أو الأصغر كما يلي:

أكاد أسمع شخصاً من تلك المجموعة قد يقول هذا المتوسّط لا يمثّلني.

فنحن نلاحظ أنّ المتوسّط هو أكبر من دخل ٨٠٪ من الأفراد. وهذا ما نراه في حياتنا اليومية، فالأشخاص من نفس الدُّفعة يتوزّعون بين مهنٍ مختلفةٍ ومنهم من يقوم بعملٍ خاصٍ قد يُدرُّ له ربحاً كبيراً أو خسارة كبيرةً.

إن أردت تمثيلاً جيداً عن هذه المجموعة قد تحتاج لعدة أرقامٍ عوضاً عن رقمٍ واحدٍ..

لعلّ وجودَ الأرقام الأخرى قد كشف عن معلوماتٍ ضروريّةٍ لفهم القيم العشر الواردة في مثالنا.

وبالنّتيجة، إنّ الصّعوبة تتمثّل باختيار رقمٍ ممثّلٍ لمجموعةٍ من الأرقام، وأنّ كلّ معيارٍ منها يكشف تفصيلاً مهمّاً عن المجموعةِ بشكلٍ كاملٍ.

يمكنك أن تطرح أسئلةً مشابهةً حول الكثير من المقالات الّتي يدّعي مؤلفوها أنّهم يطبقون المعايير الإحصائيّة الصّحيحة لقراءة البيانات بين أيديهم، وإنّما هم يخدعونك باسم الإحصاء الرّياضيّ.

المصادر:

هنا

1954 ، Darrell Huff by ، How to lie using Statistics