تطبيق تقنيات تعلُّم الآلة في تصنيف الهطول المطري
البحث العلمي والمنهجية العلمية >>>> البحث العلمي
الأخبارُ الجيدةُ هنا أنه يُمكن تصنيف المطر الهاطل لفهم الآلية التي يتشكل بها ومحاولة تفادي الحوادث الأليمة المُترتبة عليه؛ ذلك بالاعتماد على عدد محدد من المؤشرات المتعلقة بعدد حبات المطر وحجمها. ويعد فهم آلية تشكل المطر أساسًا لزيادة دقة قياس شدة الهطول المطري التي تحدث باستخدام الرادار والأقمار الصناعية.
استعرض البحث في البداية ستة أساليب لتصنيف الهطول المطري باستخدام الديسدروميتر، وقد تبين أن هذه الطرائق تعطي دقة منخفضة للتصنيف -على الرغم من إجراء تعديلات عليها- عند تطبيقها باستخدام أنواع مختلفة من الديسدروميتر أو عند تطبيقها في مواقع مختلفة جغرافيًّا.
أي إن الأنموذج يُغذّى بدخل معروف الخرج؛ أي بالبيانات عن الهطول المطري إضافة إلى النتيجة المتوقعة لنوع المطر سواء كان جبهيًّا أو ناتجًا عن تيارات الحمل، تلا ذلك اختبار الأنموذج على مجموعة البيانات الخاصة بالاختبار (testing set).
(يُمكنك قراءة المزيد عن أنواع عمليات تعلم الآلة: هنا)
وتبين بالنتيجة أن هذا التوظيف لتقنيات تعلم الآلة قد حقق دقة أعلى من جميع الأساليب التقليدية التي نُشِرَت في العقدين الأخيرين؛ خاصة في تصنيف المطر الناتج عن تيارات الحمل، وهو النوع الذي يمكن أن يتسبب -كما أسلفنا- بالفيضانات السريعة في المدن والمناطق الحضرية على وجه الخصوص.
تصنيفات الهطول المطري:
يصنف المطر إلى نوعين رئيسن:
- المطر الحاصل نتيجة تيارات الحمل الحراري (Convective)؛ التي تحدث غالبًا في فترة ما بعد الظهيرة؛ إذ تدفعُ سخونةُ الأرض الهواءَ الدافئ إلى الارتقاء نحو الأعلى حيثُ يبرد ويتمدد ليتسبب ذلك في تكاثف البخار الموجود في الهواء وسقوطه مطرًا. وتمتد الغيوم في هذه الحالة على نحوٍ عمودي وتكون الهطولات شديدة وقطرات المطر كبيرة. مثال:
Image: https://commons.wikimedia.org/wiki/File:Cumulonimbus-incus_mykonos.jpg
(صورة لشكل الغيوم المسؤولة عن المطر الناتج عن تيارات الحمل)
- المطر الحاصل نتيجة الجبهات الهوائية أو المطر الجبهي (Stratiform)؛ التي تحمل الرطوبة عادةً من المحيطات والبحار لتلتقي بجبهات هوائية أخرى تدفعها إلى الارتقاء تدريجيًّا والتكاثف على هيئة غيوم ذات امتداد أفقي. يكون المطر بهذه الحالة منخفض الشدة ويدوم طويلًا، وتبدو قطرات المطر صغيرة. مثال:
Image: https://commons.wikimedia.org/wiki/File:2018-05-18_18_27_24_Low_stratiform_clouds_(base_near_3,000_feet_AGL)_with_wavy,_bumpy_base_viewed_from_Mercer_County_Route_622_(North_Olden_Avenue)_in_Ewing_Township,_Mercer_County,_New_Jersey.jpg
(صورة لشكل الغيوم المسؤولة عن المطر الجبهي)
مصادر البيانات المُستخدمة في التدريب والاختبار:
اعتُمِدَ في هذا البحث على بيانات مأخوذة من موقعين في ولاية بافاريا في جنوب شرق ألمانيا هما: (Fürstenzell) و(Regensburg). وتضمنت البيانات تصنيفًا للغيوم الماطرة إضافة إلى تسجيلات لعدد حبات المطر وسرعاتها وأحجامها في خلال فواصل زمنية قصيرة تبلغ دقيقة واحدة، وقد سُجِّلَت هذه البيانات باستخدام جهاز الديسدروميتر (Disdrometer).
تقنيات تعلُّم الآلة المُستخدَمة في التصنيف:
كما ورد آنفًا؛ ظلت نتائجُ الأساليب التقليدية في التصنيف غيرَ مُرضية، ثُم إن الذكاء الصنعي -عمومًا- لهُ موطئ قدم في المجالات كافة على اختلاف أنواعها مثل: التنبؤ بالطقس وتصنيف الصخور وتصنيف الأراضي الزراعية من صور الأقمار الصناعية إلى ما لا نهاية له من تطبيقات واستخدامات في حياتنا اليومية.
طُبقت في هذا البحث خمسُ تقنياتٍ مُختلفة، مع العلم أن البيانات المُستخلصة هي بمثابة سمات (Features) تُدرَّب عليها النماذج، سنورد التقنيات الخمس فيما يلي:
التحليل الخطّي للعوامل المُميّزة (Linear Discriminate Analysis: LDA)
يبني هذا التحليل وصلات خطية بين السمات المُتاحة؛ الأمر الذي يزيد الاختلافات الوسطية بين التصنيفات المرغوبة في حين يقلص هذه الاختلافات ضمن كل تصنيف. يقدم هذا التحليل نَهجًا رياضيًّا وموضوعيًّا صالحًا لتعريف حدود القرار (decision bounndries) الأكثر استقرارًا بغرض أمثَلَة حدود القرار مقارنة بالتقنيات الأخرى ولتقليص معدل الخطأ.
خوارزمية الجار الأقرب (K Nearest Neighbor KNN)
تعد هذه الخوارزمية من أبسط طرائق التصنيف وتندرج ضمن طرائق التعليم الخاضع للإشراف (supervised Learning)، ثم إنها تعتمد في التصنيف على التشابه بين السمات، وتجميع عناصر كل تصنيف على أساس قياس المسافة بين كل نقطة وعدد k من النقاط الأقرب إليها في مجموعة التدريب.؛ يحدد البارامتر k حسب التجربة. تسمح هذه الخوارزمية بحساب المسافة وفق أي قانون نختاره كالمسافة الإقليدية (Euclidean distance) أو مسافة مينكوفيسكي (Minkowski) و هامينغ (Hamming)، غير أن المسافة المُختارة للاعتماد على حسابها في البحث هي المسافة الإقليدية.
خوارزمية ناييف بايز (Naïve Bayes: NB)
تقنية تصنيف تستند إلى نظرية بايز (Bayes theorem) الاحتمالية، وتقدّم تحسينًا عاليًا للأداء خاصة إن كانت البيانات المُستخدمة كبيرة جدًا؛ وقد أثبت تفوقها -رغم بساطتها- على الكثير من طرائق التنبؤ المُتقدمة والمعقدة.
تعتمد على فرضية الاستقلالية (Independence Assumption) بين السمات؛ إذ يُنظر إلى العلاقة بين السمات على أنه بعضها مُستقلٌ عن البعض الآخر، وعلى الرغم من أن هذه الفرضية غير صحيحة واقعيًا، لكنّها تقلل من تعقيد الأنموذج على نحوٍ كبير.
أشجار القرار (Conditional Trees: CT)
أحد طرائق التعلم غير الخاضع للإِشراف، تُستخدم في التصنيف والتنبؤ وتُعد طريقة سريعةً من ناحية المُعالجة وسهلةَ الفهمِ والتفسير، تحاول الخوارزمية تقسيم البيانات إلى مجموعات فرعية، ورفع نسبة التجانس (homogeneity) فيما بينها عن طريق تعلم سلسلة من القواعد أو الشروط المُحدِّدة للمسار المُتّبع حتى اتخاذ القرار النهائي.
تُستنتج هذه القواعد بالاستناد إلى السمات في كل مرة، لتُفصَل البيانات عند كل مُستوى من الشجرة حتى الوصول إلى العقد النهائية (تُسمى أوراقًا- leaves) التي تُمثل التصنيفات التي يجب اتخاذ القرار بموجبها.
الغابات العشوائية (Random Forests: RS)
تعتمد هذه الطريقة على توليد أشجار قرار مُختلفة من أجل عينات عشوائية مُختلفة من قاعدة البيانات، وبذلك تُولَّد تنبؤات جديدة بخصوص التصنيف الصحيح النهائي في كُل مرّة. من ثم تُجمع هذه التنبؤات المُختلفة بأحد الطرائق المُمكنة لذلك مثل التصويت أو حساب المتوسّط، والتصنيف الأعلى قيمة يكون هو التصنيف الصحيح.
لن يُكتفى بالمُعطيات الحالية؛ وستُستَخدَم نتائج البحث لاحقًا على نطاق أوسع في مقاطعة بافاريا بغرض مُقارنة الخصائص العامة لنوعي الهطول المطري وتحسين دقة قياسه باستخدام الرادار والأقمار الصناعية.
تفخر أسرة الباحثون السوريون بكل إنجاز علميّ يخطّه الباحثون في سعيهم لتوسيع رقعة المعرفة على هذا الكوكب، وتتمنى للسيد وائل غدا أن يعانق حلمه السحاب فيحصد مطر النجاح والتوفيق في رحلته العلميّة.
عنوان البحث باللغة الإنجليزية:
Machine Learning Approach to Classify Rain Type Based on Thies Disdrometers and Cloud Observations.
رابط البحث في دورية (Atmosphere):
هنا
يمكنكم الاطلاع على الأبحاث الأخرى المنشورة للباحث:
هنا
هنا
المصدر:
هنا