المعلوماتية > الذكاء الصنعي
كيف يمكن لروبوتٍ أن يمشي في سوقٍ مزدحمٍ بالنّاس؟
يلتزمُ السّائقون بقواعدِ الطّريقِ، كذلكَ فإنَّ مُعظّم المارّة يتّبعونَ رموزًا اجتماعيّةً معيّنةً عند التّجوّلِ في طريقٍ مزدحمٍ: فمثلًا، يجب الحفاظُ على اليمين، والتّجاوزِ من اليسارِ، والاستعدادِ لتغييرِ المسارِ لتجنُّبِ العقباتِ القادمةِ مع الحفاظِ على وتيرةِ سيرٍ ثابتةٍ.
استطاعَ المهندسونَ في معهد ماساتشوستس للّتكنولوجيا تصميمَ روبوتٍ مستقلٍّ مع نظامِ ملاحةٍ "واعيةٍ اجتماعيًّا" ويمكنُه أن يواكبَ حركةَ النّاسِ مع مراعاةِ الرّموز العامّةِ لسلوكِ المشاة.
ففي اختباراتِ القيادة الّتي أُجريت داخل مركز ستاتا في معهد ماساتشوستس للتّكنولوجيا، استطاعَ الرّوبوتُ تجنُّبَ الاصطداماتِ مع مواكبةِ متوسّطِ تدفُّق المشاة.
يقول يو فان تشن "ستيفن"، الّذي قاد العمل كطالبٍ سابقٍ في معهد ماساتشوستس للتّكنولوجيا، وهو الباحث الأساسيُّ في الدّراسة: "إنّ الملاحة الاجتماعيّةَ المدرِكةَ (الواعية) هي قدرةُ الرّوبوتاتِ المتنقّلة الّتي تعملُ في بيئاتٍ تتطلَّبُ تفاعلاتٍ متكرّرةٍ مع المشاة". "على سبيل المثال، يمكن في المستقبل أن تعملَ الرّوبوتاتُ الصّغيرةُ على الأرصفةِ لتسليمِ الطّرودِ والموادِ الغذائيّةِ، وبالمثل، يمكن لأجهزة التّنقُّلِ الشّخصيّةِ نقلَ النّاسِ في مساحاتٍ كبيرةٍ مزدحمةٍ، مثلَ مراكزِ التّسوُّقِ والمطاراتِ والمستشفيات".
وحتّى يتمكّن إنسانٌ آليٌّ من السّيرِ بشكلٍ مستقلٍ في بيئةٍ مزدحمةٍ بشكلٍ كبيرٍ، عليه أن يَحلَّ أربعةَ تحديّاتٍ أساسيّة:
تحديدُ الموقعِ (معرفة أين هو في العالم).
الإدراكُ (التّعرُّف على محيطه).
التّخطيط للحركة (تحديد المسارِ الأمثلِ لوجهةٍ معيّنةٍ).
التّحكُّم (تنفيذُ المسارِ المطلوب).
استخدم تشن وزملاؤه نهجًا معياريًّا لحلِّ مشاكلِ تحديدِ الموقعِ والإدراك. وبالنّسبةِ للأخيرةِ، فقد زوّدوا الرّوبوتَ بأجهزةِ استشعارٍ جاهزةٍ، مثل كاميراتِ الويب، وأجهزةِ استشعارِ العمق، وأجهزةِ استشعار ليدار عاليةِ الدّقة (اللّيدار أو اللّادار هو تحديدُ المدى عن طريقِ الضّوءِ أو اللّيزر، وهي تكنولوجيا استشعارٍ عن بعد مرئيّةٍ باستخدامِ نبضاتٍ من الضّوء). وبالنّسبةِ لمشكلةِ تحديدِ الموقع، استخدموا خوارزميّاتٍ مفتوحةِ المصدرِ لتعيين بيئةِ الرّوبوت وتحديدِ مكانه. أمّا من أجلِ التّحكُّم بالرّوبوت، فاستُخدمت الطّرق المعياريّةِ المستخدَمَةِ في السّيّاراتِ ذاتيّةِ القيادة.
يقول مايكل إيفرت: «الجزء من التّجربة الّذي ظننّا أنّنا بحاجةٍ إلى الابتكار فيه هو تخطيطُ الحركة»، وهو يعني كيفيّةَ تحديدِ المساراتِ التّاليةِ بمجرَّدِ معرفةِ أينَ أنتَ في العالم، ومعرفةِ كيفيّةِ اتّباعِ المسارات.
وهي مشكلةٌ صعبةُ الحلِّ ، خاصّةً في بيئاتِ المشاةِ المزدحمةِ، إذ غالبًا ما يصعب التّنبّؤ بالمساراتِ الفرديّة. وكحلٍّ، يبتَكرُ علماءُ الرّوبوتاتِ أحيانًأ طرقًا قائمةً على المسار، فيبرمجونَ الرّوبوتِ لحسابِ المساراتِ المُثلى لجميع المشاةِ المرئيّين. هنا تُستخدَمُ بياناتِ الاستشعارِ لحساب هذه المسارات، لأنَّ النّاس لن يخبروا الرّوبوتَ في أيِّ اتّجاهٍ يحاولون الذّهاب.
و يكمل إيفرت: "لكنَّ هذا يحتاجُ وقتًا طويلًا جدًّا، إذ أنّ الرّوبوتَ سيتوقّف في مكانه ليحدِّدَ ماذا يجب فعله، وفي نفس الوقت يكون المشاةُ قد انتقلوا من مكانهم قبلَ أن يُقرِّرَ الرّوبوت وجهتَه التّالية. لذلك فإنّ هذا النَّهجَ ليس واقعيًّا جدًّا، وخاصّةً إذا كُنتَ ترغب في حركةٍ أسرعَ".
ولمواجهةِ هذا التّحدي، اقتُرِحَت طرقٌ أسرعَ تعتمدُ على "ردِّ الفعل"، إذ يُزوّدُ الرّوبوتُ بنموذجٍ برمجيٍّ بسيطٍ يستخدمُ الهندسةَ أو الفيزياَء لحسابِ سرعة الطّريقِ الّذي يُتيح تجنُّبَ الاصطدامات. ويقولُ إيفرت: "إنّ المشكلةَ الّتي تواجه هذه الطّرق هي عدمُ القدرةِ على التّنبّؤِ بالطّبيعةِ البشريّةِ، فالنّاسُ نادرًا ما يلتزمونَ بطريقٍ هندسيٍّ مستقيمٍ، وقد يُغيّرونَ مساراتِهم فجأةً، أو يتوقّفونَ لتحيّةِ صديقٍ أو شراءِ بعضِ الحاجيّات، إلخ. في مثل هذه البيئة الّتي لا يمكن التّنبّؤ بها، تميلُ هذه الرّوبوتاتُ إلى الاصطدام مع النّاسِ، أو تبدو وكأنَها تُدفَعُ إلى جميعِ الاتّجاهاتِ في محاولاتٍ مفرطةٍ لتجنّبِ الاصطدام.
بعد عدّة محاولاتٍ وأبحاثٍ، تمكّن فريق معهد ماساتشوستس للتّكنولوجيا من إيجادِ طريقةٍ للتّغلُّبِ على التّحدياتِ المذكورةِ سابقَا، وبالّالي من تمكين الرّوبوتِ من التّكيُّفِ مع سلوكِ المشاةِ الّذي لا يمكن التّنبّؤُ به مع القدرةِ على التّحرُّكِ باستمرارٍ واتّباعِ القواعدَ الاجتماعيّةَ النّموذجيّةَ لسلوكِ المشاة.
استخدمَ الفريقُ لتحقيق ذلكَ التّعلُّمَ التّعزيزيّ (Reinforcement Learning)، وهو نوعٌ من أنواعِ التّعلُّمِ الآليِّ، فقاموا بعمليّةِ محاكاةٍ حاسوبيّةٍ لتدريبِ روبوتٍ على اتّخاذِ مساراتٍ معيّنةٍ آخذًا بعين الاعتبارِ سرعةَ ومسارَ الأجسامِ الأخرى في البيئةِ المحيطة. وأدرَجَ الفريقُ أيضًا المعاييرَ الاجتماعيّةَ في مرحلةِ التّدريبِ، فمثلًا كوفئَ الرّوبوتُ عندما قامَ بالتجاوزِ من جهةِ اليمين، وعوقِبَ عندما تجاوزَ من جهة اليسار.
ميزةُ التّعلُّمِ التّعزيزيِّ هو أنَّه يمكّنُ الباحثينَ من التّدرُّبِ على هذه السّيناريوهاتِ باستخدامِ المُحاكاة، إذ أنَّ هذا التّدريبَ يأخذ وقتًا طويلًا وقدرةَ حَوسَبةٍ عالية. وبعد تدريبِ الرّوبوتِ باستخدام المُحاكاة، يمكنُ للباحثينَ إطلاقه في العالم الحقيقيِّ، لِيَتَّبِعَ المساراتِ الّتي حُدِّدَت في المُحاكاة عندما يتعرّفُ على سيناريو مماثلٍ في العالم الحقيقيِّ.
وقد برمجَ الباحثونَ الرّوبوتَ على تقييمِ بيئته وضبْطِ مساره كلَّ عشرينَ ثانيةً. وبهذه الطّريقة تمكّنَ الرّوبوتُ من السّيرِ المستمرِّ بسرعةٍ نموذجيّةٍ تُقارب 1.2 مترًا في الثّانية الواحدة (في ممرّ)، ودونَ التّوقّفِ لإعادةِ برمجةِ مساره.
يقول إيفرت: "نحن لا نخطِّطُ لرسم طريقٍ كاملٍ نحو الهدف، فليسَ من المنطِّقيِّ فعلُ ذلك، خاصّةً إذا كنت تفترضُ أنَّ العالم يتغيَّرُ، نحن ننظرُ فقط إلى ما نراه، ونختارُ سرعةً، ونفعل ذلك لعشرينَ ثانيةٍ، ثمَّ ننظرُ إلى العالمِ المحيطِ مرّةً أخرى، ونختارُ سرعةً أخرى، ونسيرُ مرّةً أخرى، وبهذه الطّريقة نعتقدُ أنّ الرّوبوتَ يبدو أكثرَ طبيعيّةً، و يستطيعُ توقُّعَ ما يفعلُهُ النّاس".
قاد إيفرت وزملاؤه اختبارَ الرّوبوت في قاعاتٍ متعرِّجةٍ ومزدحمةٍ من مبنى ستاتا في معهد ماساتشوستس للتّكنولوجيا، وكانَ الرّوبوتُ قادرًا على التّحرُّكِ بشكلٍ مستقلٍّ لمدّةِ 20 دقيقةً في المرّةِ الواحدةِ، كذلكَ كانَ قادرًا على التّدفُّقِ بسلاسةٍ مع تدفُّقِ المُشاة، وقادرًا أيضًا على التّجاوزِ عن اليمين في الممرّاتِ -مع تجاوزِ النّاسِ في بعضِ الأحيانِ من اليسار- متجنِّيًا إلى جانبِ كلِّ ذلكَ أيَّ اصطداماتٍ.
ويقول إيفرت حولَ خططهِ المستقبليّةِ أنّهُ يعتزمُ استكشافَ كيفيّةِ تمكينِ الرّوبوتاتِ من التّعاملِ مع الحشودِ في بيئةٍ مكتظّةٍ بالمشاة.
فيشرحُ ذلكَ قائلًا: "للحشودِ ديناميكيّةٌ مختلفةٌ عن الأفراد، وقد تضطرُّ إلى تعلُّمِ شيءٍ مختلفٍ تمامًا إذا رأيت خمسةَ أشخاصٍ يسيرون معًا". "قد يكونُ هناك عرفٌ اجتماعيٌّ مثلًا: لا تتحرّك من خلالِ النّاس، أو لا تقسمِ النّاس، أو تعامل معهم على أنّهم كتلة ٌواحدة . هذه أبحاثٌ مستقبليّةٌ وسنعمل عليها".
المصادر:
1- هنا
2- هنا