الرياضيات > الرياضيات

السبب والنتيجة، هل يمكننا التمييز بينهما؟

اعتقد العلماء دائمًا أنه من المستحيل التمييز بين السبب والنتيجة عن طريق بيانات المراقبات.

تعتبر مقولة "الارتباط لا يعني السببية" من أكثر الأقوال المأثورة انتشارًا في الأدبيات العلمية. ولا تعوزنا الأمثلة لتوضيح ذلك. ومن الحالات الأكثر شهرةً العلاج بالهرمونات البديلة، التي درسها عددٌ من علماء الأوبئة في نهاية القرن الماضي.

فقد أظهرت الدراسات أن النساء اللواتي خضعن للعلاج بالهرمونات البديلة تنخفض لديهم احتمالات الإصابة بأمراض القلب. وعليه فمن الطبيعي أن يفترض الأطباء أن العلاج بالهرمونات البديلة يقي إلى حدٍ ما من الإصابة بأمراض القلب.

لكن تبيَّن أن هذا الافتراض خاطئ. فقد أظهرت الدراسات اللاحقة أن النساء اللواتي خضعن للعلاج بالهرمونات البديلة هنَّ على الأغلب من طبقة اجتماعية ذات دخل أعلى، وتتبع حميات وتعيش حياةً صحيةً أكثر. وهذا بالذات هو ما كان سبب الارتباط الذي وجدته الدراسات السابقة. وعلى النقيض من ذلك، بيَّنت الدراسات السريرية المناسبة أن العلاج بالهرمونات البديلة يزيد من خطر الإصابة بأمراض القلب.

يسود بين الإحصائيين الاعتقاد أنه في غياب التجارب السريرية سيكون من المستحيل تحديدُ أيُّ عاملٍ هو السبب وأيُّ عاملٍ هو النتيجة من خلال الارتباط الملحوظ لوحده. أي هل Y يُسبب X أم X يُسبب Y؟ ويبدو أن التناظر الظاهر في هذا السيناريو يستبعد إمكانية أن يكون أي اختبارٍ إحصائي قادرًا بمفرده على التمييز بينهما.

لكن، بدأ الإحصائيون في السنوات الأخيرة في استكشاف عددٍ من الطرائق الممكنة لحل هذه المعضلة. ويقولون إنه في الواقع وفي ظروفٍ محدَّدة يمكن تمييز السبب من النتيجة اعتمادًا على البيانات الملحوظة وحسب.

للوهلة الأولى يبدو هذا الكلام خطيرًا. لكن أظهر جوريس مويج Joris Mooij وزملاؤه من جامعة أمستردام في هولندا مقدار كفاءة هذه المقاربة الجديدة من خلال تطبيقها على مجموعاتٍ من البيانات الحقيقية والاصطناعية. وكان استنتاجهم الجدير بالملاحظة هو أنه بالإمكان الفصل بين السبب والنتيجة بهذه الطريقة.

قيَّد مويج وزملاؤه أنفسهم بالبيانات البسيطة المتعلقة بمتحولين اثنين، X و Y. من الأمثلة الواقعية على مثل هذه البيانات يمكن أن تكون مجموعة البيانات لقياس سرعة الرياح، المتحول X، وتُظهر المجموعة الأخرى سرعة دوران عنفة (توربين) هوائية، المتحول Y.

من الواضح أن هاتين المجموعتين من البيانات بينهما ارتباط، لكن أيهما هو السبب وأيهما النتيجة؟ ودون العودة إلى التجارب المراقبة سيكون من السهل تصوُّر استحالة التحديد.

تستند المقاربة الجديدة إلى الافتراض بأن العلاقة بين المتحولين X و Y غير متناظرة. بقولٍ آخر يقول الفريق أنه في أي مجموعة من القياسات سيكون هناك دائمًا ضجيج(1) ( تشويش ) من مصادر عدَّة. مربط الفرس في المقاربة هو أن نمط الضجيج في السبب سيختلف عن نمطه في النتيجة. وذلك لأن أي ضجيجٍ في قيم المتحول X سيكون لها تأثير على قيم المتحول Y، ولكن العكس ليس صحيحًا.

لهذا فإن مجموعة البيانات عليها أن تعكس ذلك. وتفترض هذه المقاربة أن أية مجموعة بيانات تتكون من البيانات ذات الصِلة بالموضوع المدروس إضافةً إلى مصادر التشويش أو الضجيج المتعددة. وقد أوضح الإحصائيون أن هذا الارتباط غير الخطي لهذه العملية يمكنه أن يسمح بتحديد اتجاه العلاقة بين السبب والنتيجة.

ولقد اختبر مويج وزملاؤه كيف تعمل (أو تُطبَّق) هذه المقاربة على تشكيلةٍ واسعةٍ من مجموعات البيانات التي تمَّ جمعها وتصنيفها لهذا الغرض. تتألف كل مجموعة بيانات من عينة من أزواجٍ من المتحولات العشوائية المستقلة إحصائيًا المعروف أيٌ منها هو مُسبب للآخر. وكان المطلوب تحديد أيُّ متحولٍ منهما هو السبب، وأيهما هو النتيجة بالاعتماد على المقاربة الجديدة المقترحة.

وفي المحصلة جمع مويج وزملاؤه 88 مجموعة بيانات ذوات أزواج من السبب والنتيجة من أكثر من 30 مجالًا علميًا مختلفًا. فقد كان لديهم على سبيل المثال بيانات عن الارتفاع عن سطح البحر ومتوسط درجة الحرارة السنوي لأكثر من 300 محطة أرصاد جوية في ألمانيا. يقول مويج وزملاؤه أنه من الواضح أن الارتفاع عن سطح البحر هو ما يُسبب تغير درجة الحرارة وليس تغيُّر درجة الحرارة هو ما يؤثر على الارتفاع، لكن تحديد ذلك من البيانات لوحدها ليس بالأمر الواضح والمباشر.

تتعلَّق مجموعة بياناتٍ أخرى بهطول الثلج اليومي في ويستلر Whistler في كندا وتتضمن قياسات لدرجة الحرارة والكمية الإجمالية للثلج. من الواضح أيضًا أن درجة الحرارة هي أحد الأسباب التي تُحدد الكمية الكلية للثلج، وليس العكس.

وتحوي مجموعةٌ ثالثةٌ بياناتٍ عن أسعار آجار الغُرف والشُّقق للطلاب وتضم حجم الشقة والآجار الشهري لها. ومن الجليّ أن حجم الشقة هو ما يُحدد مقدار الآجار الشهري، وليس العكس. وفي الإجمال يوجد 88 مجموعة بيانات مختلفة مترافقة مع المعرفة الأساسية الحقيقية عن أي متحولٍ هو السبب وأي متحول هو النتيجة.

استخدم مويج وزملاؤه نموذج الضجيج الجمعي لتحديد أيٌّ المتحولين هو السبب وأيُّهما هو النتيجة.

وكانت النتائج مشوِّقةً. فهم يدَّعون بأن نموذج الضجيج الجمعي كان دقيقًا بنسبة ثمانين بالمئة في تحديد السبب والنتيجة بشكلٍ صحيح. كما يذهبون إلى أن هذه الطريقة صامدة في مواجهة التشويش البسيط في البيانات الناجم عن طريقة معالجة البيانات احصائيًا. ويستنتجون: "إن نتائجنا التجريبية تُقدِّم الدليل على طرائق الضجيج الجمعي هي في الواقع قادرةٌ على التمييز بين السبب والنتيجة بالاستعانة بالبيانات الملحوظة وحسب".

وإن هذه الأمرٌ رائعٌ، فهو يعني أنه لدى الإحصائيين سببٌ وجيهٌ لمساءلة الحكمة الراسخة التي تنص على أنه من المستحيل تحديد السبب عن النتيجة من البيانات الملحوظة وحدها.

ومن الجدير الإشارة إلى أن هذه النتائج تنطبق على الحالات البسيطة للغاية التي يكون فيها أحد المتحولين مُسببًا للآخر. غير أن هناك حالاتٍ كثيرةً أكثرُ تعقيدًا لن تكون هذه الطريقة فيها مثمرةً.

ومع ذلك ستكون هذه الطريقةُ أداةً جديدةً فعالةً بين يدي الإحصائيين. إذ يوجد العديد من الحالات في العلم التي يكون فيها إجراء التجارب المراقبة غير ممكنٍ إما لأنها مكلفةٌ جدًا أو لأنها غير أخلاقية أو لأنها مستحيلة. وفي مثل هذه الحالات يمكن لنموذج الضجيج الجمعي أن يكون بيضة القبان التي تغيير قوانين اللعب .

ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

(1) نماذج الضجيج تُستخدم لمحاكاة تأثير العوامل العشوائية الخارجية على الظواهر المدروسة .

المصدر: هنا