المعلوماتية > الذكاء الصنعي

خوارزمية تتنبأ بسلوك البشر أفضل من البشر أنفسهم!

يقومُ علمُ البيانات على استخلاصِ رؤًى وأفكارٍ ومعارفَ ونماذجَ تنبؤية من البيانات، حيث ينطوي هذا المسعى على عدة مراحل، تتم في كل مرحلة عمليةُ تنظيفٍ وتنظيم للبيانات ونشر نتائجها للمرحلة التالية.

توضح الصورة التالية ما يتضمنه علم البيانات من معارف:

لمعلومات أكثر شاهد الفيديو من هنا.

يقول الباحثون أنه بعد التطور والانتشار الناجحَيْن للأنظمة والبرمجيات القادرة وبكفاءة على تخزين البيانات واستعادتها ومعالجتها، تحوّل الاهتمامُ الآن إلى التحليلات بشقّـيْها التنبؤية (كالتنبؤ بالطقس) والترابطية (كإيجاد العلاقة بين حرارة الطقس ورطوبته وحوادث الحريق). إذ يسعى الباحثون لجعل هذا المسعى أكثرَ كفاءة ومتعةً ونجاحًا.

عادةً ما يعتمدُ تحليلُ مجموعة ضخمة من البيانات من أجل التنبؤ بالتوجهات العامة(كالمواضيع الأكثر شيوعاً ومناقشةً في شبكات التواصل الاجتماعي)، أو التنبؤ بسلوك المستهلك على كلٍّ من الحواسيب والبشر، ورغم تطور الخوارزميات الحاسوبية بشكل كافٍ لتحلِّـلَ وبسرعة كبيرة مجموعةً البيانات هذه لتستخلصَ منها الأنماطَ المفيدة، يبقى دورُ البشر ضروريًّا في تعيين المعاملات وتحليل النتائج المتعلقة بالسلوك البشري. لكن الخوارزمية التي تمَّ التوصُّلُ إليها من قِبل معهد «ماساتشوستس» للتكنولوجيا يُمكنها القيامُ حتى بهذا الدور البشري الذي ينطوي على وجود الحدس.

لقد تصور «ماكس كانتر»- طالب الدراسات العليا في معهد ماساتشوستس- ومشرفُه أنه يُمكن للآلة التي أطلقوا عليها اسمَ((Data Science) أن تُقرب حدس الإنسان عندما يتعلق الأمر بتحليل البيانات؛ حيث يُمكن وباستخدام مجموعةٍ من البيانات بناءُ نماذجَ تتنبؤ بأشياءَ متنوعة؛ على سبيل المثال، متى يكون طالبٌ ما أكثرَ عرضة للسقوط في مقرر تعليمي. يقول مبتكرو هذه الآلة أنه يُمكنها القيام بهذه المهام بشكل أسرعَ وبدقةٍ أكبرَ من البشر.

لاختبار النموذج الأولي لهذا النظام حرص الباحثون على وضع آلتهم هذه في مواجهةٍ مع فِرَق بشريّةٍ ضمن ثلاث مسابقات متعلقة بعلم البيانات، حيث توصلت هذه الآلةُ إلى نتائجَ أكثر دقة من 615 فريق من أصل 906 فرق. وبينما عمل البشرُ على خوارزمياتهم التنبؤية لعدة أشهر، تطلبت هذه الآلة من ساعتين إلى 12 ساعة لمعالجة كلِّ مدخلات هذه المنافسات الثلاث.

كمثال على هذه الاختبارات، طُلب من الفِرَق في إحدى المنافسات أن تتنبأ فيما إذا كان الطالبُ سيتسرّبُ خلال العشرة أيامٍ القادمة (كما ذكرنا منذ قليل)، وذلك استناداً إلى تفاعل الطالبِ مع موارد المقرر المتاحة على شبكة الإنترنت. كان آداءُ الآلة (Data Science) جيداً في هذه المنافسة إضافة إلى منافستين أخرتين. في إحداهن طُلب من المشاركين التنبؤ فيما إذا كان يُمكن أن يُعدُّ مشروع ما مُمَوّل من قِبل الجماهير «مثيرًا». أما في المنافسة الثالثة طُلب منهم التنبؤ فيما إذا كان من الممكن أن يتحولَ زبون ما إلى مشترٍ دائم.

يقول الباحثون أن العديد من مشاكل علم البيانات (data science) لديها خصائص شائعة:

1. البيانات مهيكلة وعلاقاتية؛ عادة ما تُمثّل ضمن مجموعة من الجداول مع وصلات علاقاتية فيما بينها.

2. تلتقط البيانات بعضاً من جوانب التفاعل البشري مع الأنظمة المعقدة.

3. تحاول المشكلة المُقدمة أن تتنبأ ببعض جوانب السلوك والقرارات والأنشطة البشرية. على سبيل المثال: أين سيذهب الراكب في سيارة الأجرة؟

بفرض وجود مشكلةِ تنبؤ ما فإن الخطوة الأولى اللازمة للتعامل معها هي أن يبدأَ عالمُ البيانات بتشكيل المتحولات أو ما يُعرف باسم السّمات، حيث يُمكنه البدء باختيار بعض الحقول الثابتة من جداول البيانات كالعمر أو الجنس على أنها سماتٌ أولية، ثم يقوم بعد ذلك وبالاعتماد على حدسه في تنبؤ الخرج بتشكيل سماتٍ متخصصة أكثر. أما في الخطوة التالية، يقوم عالمُ البيانات بتطوير سماتٍ جديدة وذلك بتحويل حقولِ البيانات الخام إلى مقاييسَ مختلفة (على سبيل المثال: نسبة مئوية من سمة معينة كالنسبة المئوية للمستهلكين دون الـ25 عاماً). انظر الشكل أدناه.

المسعى النموذجي لعلم البيانات:

من اليسار إلى اليمين يبدأ هذه المسعى أولاً بمحلّل البيانات الذي يطرح السؤال التالي: هل يمكن لنا أن تنبأ أن المتحول x أو المتحول y مرتبط بالمتحول z؟ عادة ما تُطرح هذه الأسئلة بناءً على حاجة شركة الأعمال أو حاجة الباحث الممتلكِ لهذه البيانات. ثانياً، يأتي دور مهندس البيانات الذي يقوم بكتابة أكواد برمجية لاستخراج هذه المتحولات. ثالثاً، يقوم باحثُ التعلّم التلقائي ببناء نماذجَ تراعي الأهداف التنبؤية المعطاة واختبارها والتحقق من نتائجها.

لا ينظر الباحثون لخوازرمية التنبؤ هذه على أنها بديلٌ لذكاء الإنسان، لكنهم يدركون أنها يُمكن أن تكونَ مفيدة في تحليل كمية كبيرة من البيانات مع أقلِّ قوى بشرية عاملة. من الممكن أن تكونَ أيضاً أداةً مهمة للتصميم المرتكز على المستخدم، فإذا كان بمقدور الآلة معالجةُ كميات ضخمة من البيانات مع أقل قوى عاملة وفي وقت قياسي، فإن ذلك يُساعد الشركاتِ أيضاً على فهمٍ أفضلَ لقاعدة زبائنهم آخذين في الحسبان السلوك المستقبلي المُتنبأ به.

المصدر:

هنا