الخداع باسم الإحصاء الرياضيّ
الرياضيات >>>> الرياضيات
نشرت جريدةٌ في نيويورك مقالةً بعنوان " إنّ متوسط دخل خريج جامعة ييل هو 25،111 دولار" قد يبدو هذا الرّقم المتواضع بعصرنا الحاضر هو رقم مبالغ به جداً في الفترة التي كُتب بها ذلك المقال وهو عام 1954.
لك أن تقيس على هذا المعيار الكثير والكثير من المقالات الّتي تعطي انطباعاً أنّ كاتبيه قد تبنَّوا الدّقة العلميّة في الوصول إلى النّتيجة المُقررة.
بدايةً، لن أهتّم بالأمور التّقنية الّتي يُعنى بها الاختصاصيّون لربط السّبب بالنّتيجة، ولكن ما يلفت الانتباه هنا هو كيف يمكن للباحث أن يستخدمَ الإحصاء ليُظهر البيانات الّتي يرغب بها.
لنُعرّف الآن بعض الأدوات الإحصائيّة ليتضح الفهم عندما نبحث في خصائص تلك الأدوات.
المتوسط: وهو مجموع الأعداد مقسوماً على عددها.
الوسيط: هو العدد الّذي يقع في منتصف سلسلة الأعداد المُرَتّبة.
الرُّبيّع الأول: هو العدد الّذي يُنَصِّف النّصف الأصغر من متسلسلة الأعداد المُرَتّبة.
الرُّبيّع الثالث: هو العدد الّذي يُنَصِّف النّصف الأكبر من متسلسلة الأعداد المُرَتّبة.
Image: Syrian Researchers
لما لا نقوم بطرح بعض الأسئلة حول ما يحمله مقال الجريدة " إنّ متوسّط دخل خرّيج جامعة ييل هو 25،111 دولار"؟
يف وصل كاتب المقال لهذا الرّقم الدّقيق، لِمَ لَمْ يَذكر أنّ المتوسّط كان حوالي 25،000 دولار؟ ما هي الطّريقة المُتّبعة للحصول على مثل هذا المتوسّط؟ والسّؤالُ الأهمُّ هل يُعتبر المُتوسّط أفضلَ أداةٍ للتّعبير عن دخل الخرّيجين؟
لقد بحث الكاتب داريل هاف Darrell Huff هذا المثال في أوّل كتابه : كيف تكذب باستخدام الإحصاء "How To Lie with Statistics". وقد أثار شكوكاً أكثرَ حول صحة المقال، فقد سُئل هل أجاب جميعَ الخرّيجين عن هذا الإحصاء؟ هل كذب بعضهم حول دخله كما هي عادة بعض الأشخاص؟ لاشكّ أنّ هذه الأسئلة قد تنسف النّتيجة بشكلٍ كاملٍ. سأفترض أنّ كاتب المقال قد قام بكلِّ ما باستطاعته لكي يتحقق من البيانات الّتي وردته، وأنّه استقصى عدداً كافياً ليصل لنتيجةٍ مناسبةٍ واقعيّةٍ، واعتراضي الشّخصيّ هو عن الأداة الإحصائيّة الّتي قام مُعِدّو المقال بالاعتماد عليها. هل يُعتَبر المتوسّط الحسابيّ هو أفضل دليلٍ عن دخل خرّيجي الجامعة؟.
لتوضيح مأخذي عن استخدام المتوسّط الحسابيّ، سنعرض المثال الرّقميَّ التّالي:
مثال: لتكن المجموعة التّالية هي دخل ١٠ من خرّيجي الجامعة:
Image: Syrian Researchers
إنّ المتوسّط لتلك المجموعة هو: ١٦،٤١٠ ، لنقارن المتوسّط مع دخل الأفراد العشر بأن نذكر الأكبر أو الأصغر كما يلي:
Image: Syrian Researchers
أكاد أسمع شخصاً من تلك المجموعة قد يقول هذا المتوسّط لا يمثّلني.
فنحن نلاحظ أنّ المتوسّط هو أكبر من دخل ٨٠٪ من الأفراد. وهذا ما نراه في حياتنا اليومية، فالأشخاص من نفس الدُّفعة يتوزّعون بين مهنٍ مختلفةٍ ومنهم من يقوم بعملٍ خاصٍ قد يُدرُّ له ربحاً كبيراً أو خسارة كبيرةً.
إن أردت تمثيلاً جيداً عن هذه المجموعة قد تحتاج لعدة أرقامٍ عوضاً عن رقمٍ واحدٍ..
Image: Syrian Researchers
لعلّ وجودَ الأرقام الأخرى قد كشف عن معلوماتٍ ضروريّةٍ لفهم القيم العشر الواردة في مثالنا.
وبالنّتيجة، إنّ الصّعوبة تتمثّل باختيار رقمٍ ممثّلٍ لمجموعةٍ من الأرقام، وأنّ كلّ معيارٍ منها يكشف تفصيلاً مهمّاً عن المجموعةِ بشكلٍ كاملٍ.
يمكنك أن تطرح أسئلةً مشابهةً حول الكثير من المقالات الّتي يدّعي مؤلفوها أنّهم يطبقون المعايير الإحصائيّة الصّحيحة لقراءة البيانات بين أيديهم، وإنّما هم يخدعونك باسم الإحصاء الرّياضيّ.
المصادر:
هنا
1954 ، Darrell Huff by ، How to lie using Statistics