الرياضيات > الرياضيات
إحصاء اللّامرئيّ من خلال الإحصاء
إنّ السّؤالَ: "كم ... ؟" سهلٌ جِدًّا نظريًّا فما نحتاجُه هو المقدرةُ على العدِّ فقط، أمّاعمليًّا فالإجابةُ عليهِ صعبةٌ للغايةِ، لنرى من خلالِ مقالنا هذا كيف يتمُّ -في مجتمعٍ ما- إحصاءُ فئةٍ معيّنةٍ تُحقّقُ خواصًّا محدَّدةً وليسَ جميعُ أفرادِها مرئيًّا أمامنا.
كم عددُ الأفرادِ الّذين يعيشونّ كرقٍّ في المملكةِ المتّحدةِ؟
كم عددُ المهاجرينَ غيرُ الشّرعيّينَ الّذين دخلوا المملكةَ المُتّحدةَ في العامِ الماضي؟
كم عددُ الباندا العملاقة الّتي تعيشُ في البرّيّةِ هناك؟
في حالةِ فئاتٍ كهذهِ ليسَ مُمكنًا مُطابقةُ وعدُّ هذه الأفرادِ بسهولةٍ، ذلك أنّهم غالبًا ما يكونونَ محجوبين. وبناءً عليه، كيف لنا أن نُجيبَ على سؤالِ "كم ... ؟" بسهولةٍ إن كنّا لانستطيعُ عدَّ جميعَ عناصرِ فئةٍ مُعطاة؟ ببساطةٍ، نستطيعُ التّخمينَ- إلا أنّ هذه الطّريقة ليست علميّة.
عام 1802، شرَعَ عالمُ الرّياضياتِ الفرنسيِّ بيير-سيمون دُ لابلاس (1749-1827) بتخمينِ عددِ سكّانِ فرنسا. لم يكن الإحصاءُ السّكّانيُّ لفرنسا بأكملِها محسوبًا على الرّغمِ من كونه كذلك لبعضِ الأقاليم.
طبّقَ لابلاس نَهْجَ (طريقةَ) عيّنةِ الاستبيانِ مرّتين، حين استعملَ عيّنَتين متوفِّرَتَين من سكّان فرنسا مؤلَّفَتَينِ من سجلّاتِ الميلادِ (اللّائحة A) وأخرى متوفِّرَةٍ لبياناتِ الاستبيانِ الإحصائيِّ الإقليميِّ (اللّائحة B). عندئذٍ سيكون كلُّ فردٍ مُراقَبٌ في الدّراسةِ موجودًا تمامًا في إحدى الفئاتِ الثّلاث:
- موجودٌ في كِلا اللّائحتين A و B.
- موجودٌ في اللّائحةِ A وغيرُ موجودٍ في اللّائحة B.
- موجودٌ في اللّائحة B وغيرُ موجودٍ في اللّائحةِ A.
تُلخَّصُ البياناتُ كعددِ الأفرادِ الموجودينَ في الفئاتِ الثّلاث هذه، إلّا أنّ حجمَ السُّكّان الحقيقيّ، ليس فقط الأفرادَ الموجودين في الدّراسةِ، ذلك لوجودِ تقصيرٌ في شملِ أولئك الأفرادِ غيرِ الموجودينَ في اللّائحة A أو في اللّائحة B. يُسمَّى عددُ الأفرادِ غيرِ الموجودينَ في إحدى اللّائحتين العددَ المُخبَّأ أو العددَ المُظلِم.
ومع ذلك، فإنّ نمطَ عددِ الأفرادِ المُراقَبِين وفقَ المعطياتِ الثّلاث المختلفةِ كافٍ لتقديرِ إجماليِّ حجمِ السُّكّانِ باستخدامِ ما هو معروفٌ نموذجيًّا بـِ "مُقَدّر (مخمِِّن) لينكولن-بيترسون":
إنّ الفكرةَ الأساسيّةَ كالتّالي. نأخذُ الكميّتَين:
- نسبةُ عددِ السُّكّانِ الكليِّ المسجَّلينَ على اللّائحة A.
- نسبةُ الأفرادِ المُسجَّلينَ على اللّائحة B وَالمُسجَّلينَ على اللّائحة A أيضًا.
سنعتبر هاتَينِ الكميّتَين وكأنَّهما تقريبًا الكميّةُ ذاتها فيما لو كانَ احتمالُ أن يكونَ الفردُ مسجَّلًا على اللّائحةِ A لايتأثَّرُ بكونِهِ مُسجَّلًا على اللّائحةِ B أم لا ؛ تزوّدنا مساواةُ هاتين النّسبَتَين المُلاحَظَتَين للبياناتِ بتخمينٍ لعددِ السُّكّان.
مُقدِّر لينكولِن-بيتِرسون:
البيانات:
- العددُ الكلِّي للأفرادِ الموجودينَ على اللائحة A هو: U
- العدد الكلِّي للأفراد الموجودين على اللائحة B هو: V
- العدد الكلِّي للأفراد الموجودين على اللائحة A و اللائحة B هو: W
مُخمِّن لينكولِن-بيتِرسون لعدد السكان الكلي"
باستخدامِ هذا النّهجِ، قدَّر دُ لابلاس عددَ سكانِ فرنسا بـ 28.3 مليون. و هذا ما يُقاربُ حساباتٍ أخرى له في تلكَ الأثناء، على سبيل المثالِ، 27.5 مليون عام 1801.
من الممكنِ أن يُعمَّم النّهجُ المُضعَّفُ للعيّنةِ إلى نهجِ عيّناتٍ متعدِّدةٍ، حيث تُستَعمَل لوائحُ متعدِّدةٌ لتسجيلِ الأفرادِ. تعتمد البياناتُ أيضًا على عددِ الأفرادِ الموجودينَ في كلِّ تركيبةٍ للّوائحِ، ولكن هنا لدينا إمكانياتٍ متعدِّدةً أكثرَ للفئات.
على سبيل المثال، إذا كان لدينا ثلاثُ لوائحَ A و B و C: تكون الفئات كالتّالي :
- في A وليس في B وَ C .
- في B وليس في A وَ C .
- في C وليس في A وَ B .
- في A وَ B و ليس في C.
- في A وَ C و ليس في B .
- في B وَ C و ليس في A.
- في A وَ B وَ C .
بإمكاننا التّعميمُ من أجل k لائحة، حيث عدد الفئاتِ الممكنة (2k-1) فئة.
إذا كان لدينا ثلاثُ لوائحَ أو أكثر، فإنّنا قادرينَ على إدراجِ تداخلاتٍ فيما بين اللّوائح. بتعبيرٍ آخر، السّماح للحالةِ المُسجَّلَةِ على لائحةٍ ما أن تُسجَّلَ على لائحةٍ أخرى وبالعكس. كما أنّه من الممكنِ أن يؤدّي حذفُ التّداخلاتِ ذاتِ الأهميّةِ فيما بين اللّوائحِ إلى تقديراتٍ سيّئةٍ- إمّا تقديرٌ أكبرَ أو تقديرٌ أقلَّ من قيمةِ العددِ الحقيقيِّ.
وبناءً عليه، إنَّ تقديرَ عددِ السُّكّانِ يتمُّ على خطوتَين: (i)تحديدُ التّداخلاتِ الّتي سيتمُّ إدراجها ، (ii) تقديرُ حجمِ عددِ السُّكّانِ الكلّيِّ اعتمادًا على التّداخلاتِ الموجودةِ (المُدرَجَة في الخطوةِ السّابقةِ).
استُخدِم مؤخَّراً نهجُ العيّنةِ المتعدِّد لتقديرِ عدد العبيدِ في المملكةِ المتَّحدةِ. إنّ تقديرَ عددٍ مجهولٍ كهذا ذا أهميّةٍ اجتماعيّةٍ واقتصاديّةٍ مباشرةٍ ويزوِّدُ بتقديرٍ لاِتّساعِ المشكلةِ الّذي يؤدّي بدوره إلى تحرُّكاتٍ وسياساتٍ أبعد.
استُخدِمَت خمسُ لوائحَ من البياناتِ في تطبيق نهجِ العيّنة المُتعدِّد. كانت مصادرُ كلَّ لائحةٍ: السُّلطة المحليّة، والمنظّمة اللاّحكوميّة، وقوى الأمن، ومكتبُ الجرائمِ القوميّة، والمنظّمةُ الحكوميّة والعوام . نتج عن هذه اللّوائحِ إجماليّ من 31 فئةً مُمكنةً بحيث يقعُ كلُّ فردٍ مُلاحَظٍ فيها. تمّت الملاحظّةُ على إجمالي من 2744 فردٍ على حِدىً. أدّى إجراءُ الخطوتَين إلى تعيين 6 تداخُلاتٍ على نحوٍ أساسيٍّ. و استُتْبِعَ هذا بتداخلٍ إيجابيٍّ بين لائحتَي السّلطةِ المحليّةِ وقوى الأمنِ- كون المُلاحَظِ من قبل قوى الأمنِ يؤدّي إلى فرصةٍ متزايدةٍ من كونِه ملاحظًاا من قِبَلِ السّلطةِ المحليّةِ والعكسُ بالعكسِ.
من الممكن أنّ يكون هذا متوقَّعًا إذا كان هناك اتّصالًا جيّدًا بين هذه الهيئاتِ الحكوميّةِ. قُدِّر عددُ السُّكّانِ الكلّيِّ بـ 11.300 ( بمجالِ ثقةٍ بين 9900 و 13050 ) . و هذا يعني أنّه تمَّ تقديرُ أنّ أقلَّ من 25% من عدد السكان قد طُوبِق.
هل أوجدنا، من خلالِ ما سبقَ عرضُهُ، حلًّا كاملًا لمسألةِ: كيف نُجيب على السّؤالِ «كم.. ؟» لسوءِ الحظِّ كلَّا. صحيحٌ أنّ النّهجَ السّابقَ يزوِّدنا بتقديرٍ، إلّا أنّنا نُتْبِعُ التّقديرَ بالسّؤالِ «هل بإمكاننا القيامُ بما هو أفضل؟» الإجابةُ دائمًا «نعم»- كما يتضمّنُ التّحليلُ الإحصائيُّ مستوىً من التّبسيطِ دومًا. على سبيل المثال، تضمَّنت تحديثاتٌ جديدةٌ دمجَ معلوماتٍ إضافيّةٍ، كجنسِ وعمرِ الأفرادِ المُلاحَظين في التّحليل. إنّ فرضيّةَ أنَّ جميعَ الأفرادِ المُسجَّلِينَ على اللّوائحِ هم أعضاءٌ في المجتمعِ المدروسِ مأخوذةٌ بعينِ الاعتبار أيضًا - وقد بُرهِنَ ظهورُ انحيازٍ ملحوظٍ لتقديرِ حجمِ عددِ السُّكّانِ في حالِ عدمِ تحقُّقِ هذهِ الفرضيّةِ وعدمِ أخذِها بعينِ الاعتبارِ أثناءَ التّحليلِ الإحصائيِّ. والأكثرُ من ذلك، لقد عُمِّمَت الطُّرقُ لتسمحَ بإدراجٍ منهجيٍّ لمعلوماتٍ إضافيّةٍ مُتعلِّقةٍ بتقديراتِ حجمِ عددِ السُّكّانِ و/ أو بالاعتمادِ على ما يُسمَّى بنهجِ بايزيِنBayesian approach. إنّ التّقدُّماتِ في التّقنيّاتِ الإحصائيّةِ المُتوفِّرَةِ مساحةٌ للبحثِ المستمرِّ.
ماسبقَ ذكره فضولٌ علميٌّ أساسيٌّ يقودُ تطوّرَ الأدواتِ والتّقنيّاتِ الرّياضياتيّةِ الجديدةِ - وهو سببُ الأهميّةِ الكبيرةِ للأبحاثِ الإحصائيّةِ. أمّا بالنّسبةِ لعددِ الأفرادِ الّذينَ يعيشونَ كرقٍّ في المملكةِ المتّحدةِ فقد قُدِّرَ بأكثرَ من 13,000 رقيق.
والآن أصبحَ بإمكانِ الفضوليّين إيجادُ القيمةِ التّقريبيّةِ لعددِ مايريدونَ حسابَ عدده باِتّباعِ الخطواتِ المذكورةِ آنفًا. كما أنّ معظمَ النّتائجِ الّتي نقرؤها في دراساتٍ إحصائيّةٍ كالّتي سبق ذكرها هي نتائجُ تقريبيّةٌ وكلّما كان عددُ اللّوائحِ أكثرَ - وبالتّالي التّداخلات فيما بينها أكثر- كلّما كانت النّتائجُ أقربَ إلى الحقيقةِ، وعلى الرّغم من كونها نتائجَ تقريبيّةً إلّا أنّها من الأهميّةِ بمكان وتُبنى عليها تعميماتٌ عِدّةٌ وتُعتَبرُ دعائمُ لدراساتٍ أخرى. أجَل هكذا يكونُ الحالُ حين لانستطيع رؤيةَ اللّامرئيّ- لأنّه ببساطةٍ غيرُ مرئيٍّ بالنّسبةِ إلينا- .والسّؤال الّذي يطرحُ نفسه في هذا الخصوص إلى أينَ سيصّلُ الباحثون الحاليّون وإلى أينَ سيصلُ من سيخلفُهم من الباحثينَ في سرعةِ إيجادِ نتائجَ دراساتٍ كهذه وتخفيضِ نسبةِ الخطأ فيها؟
المصادر: