جديد الذكاء الاصطناعي … روبوتات فضوليّة
الهندسة والآليات >>>> الروبوتات
إذًا هل من الممكن حقًا أن تتمتّع الرّوبوتات بالفضول؟
يقول جورج كونيداريس "George Konidaris"؛ عالم الحاسبِ الآليّ الّذي يدير مخبَر الروبوتات الذّكيّة في جامعة براون: "إنّ تطويرَ صفةِ الفضولِ هو لبّ حلّ مسألة الذّكاء، وكم سيكون رائعًا ألّا يكون لديك صورةً كاملةً عمّا ستفعله روبوتاتك في المستقبل".
عمل علماء الذّكاء الاصطناعيَ على مرَ السّنين على خوارزميّاتٍ من شأنها زرعُ الفضول في الرّوبوتات، لكن نسخ حبّ الاستطلاع الّذي يميّز الكائنات الحيّة كانَ مسألةً شاقّةً للغاية. فعلى سبيل المثال؛ يُمكن للبشر أن يحكموا بكلّ سهولةٍ على أهميّة كتابٍ من خلال غلافه فقط، لكنّ معظم الطّرائقِ الّتي جرّبها الباحثونَ كانت غير نافعةٍ لجعل الذّكاء الاصطناعيّ قادرًا على التّنبؤ بالأشياءِ المثيرةِ قبل تجربتها فعلًا.
يأمل تود هيستر "Todd Hester"؛ عالم الحاسب الّذي يعملُ في مخبر "Deep Mind"، أن يتمكّن الذّكاء الاصطناعيَ من إنجازِ أكثرِ من ذلك، حيث قال: "كنت أبحث عن طرائقَ لجعل أجهزةِ الحاسب قادرةً على التّعلّم بذكاءٍ أكثر، والاستكشافُ كما يفعلُ بنو البشر، لا تستكشف كلّ شيء، ولا تستكشف عشوائيّاً، ولكن تحاول أن تؤدّي المهامّ بذكاءٍ أكبر".
وضع كلّ من هيستر وبيتر ستون؛ والأخير هو أيضًا عالم حاسبٍ آليّ في جامعة تكساس في أوستن، خوارزميّةً جديدةً اسمها "TEXPLORE-VENIR". تعتمد هذه الخوارزميّةُ على تقنيّةٍ تُسمى التّعلّم المُعزّز. في التّعلّم المُعزّز، يحاول البرنامج أن ينجز شيئاً ما، وإذا كانت خطواته تُقرّبه من هدفه النّهائي، كالوصولِ إلى نهاية المتاهة، فإنّه يتلقّى مكافأةً صغيرةً على عمله.
استخدمت "Deep Mind" التّعلّم المُعزّز سابقًا، ممّا جعل الذّكاء الاصطناعيّ الّذي تُطوّره قادرًا على إتقانِ الألعابِ الإلكترونيّةٍ؛ مثل ألعاب "أتاري" وكذلك إتقانُ لعبةِ غو الصّينية القديمة، وذلك عبر التّجريب العشوائيّ. لكنّ خوارزميّة "TEXPLORE-VENIR" لا تعتمدُ على التّجريب العشوائيّ، إنّما تُشبهُ خوارزميّات الفضولِ الأُخرى، تُحدّدُ الهدف الدّاخليّ ومن ثمّ تُكافئ نفسها عندما تتعلّم شيئًا جديدًا.
إذاً تتعلّم خوارزميّة "TEXPLORE-VENIR" وتبني نموذجاً لمحيطها،ثمّ تكافئ نفسها لاكتشافِ المعلومات الّتي لم تتعلّمها مُسبقًا. على سبيل المثال، تُكافئ الخوارزميّة نفسها عندما تجدُ بقعةً جديدةً على الخريطة، أو مثلًا عندما تتعلّم وصفةً جديدةً في حال كانتِ الخوارزميّةُ تتعلّم الطبخ. تُكافئ الخوارزميّة نفسها للحدّ من عدم اليقين، لتُصبح تلك الأماكنُ والوصفاتُ الجديدة مألوفةً أكثر.
الاختبار العمليّ للخوارزميّة الجديدة:
اختبر الباحثانِ هستر وستون الخوارزميّة في سيناريوهين مختلفين. السيناريو الأوّل: متاهةٌ افتراضيّةٌ تتكوّن من دائرةٍ تُشكلّها أربع غرفٍ متّصلةٍ بأبوابٍ مقفلة، وعلى البرنامجِ الحاسوبيّ أن يعثر على مفتاحٍ في إحدى الغرفِ لاستخدامه في فتح الباب. في كلّ مرّةٍ يمرّ البرنامج من خلال أيّ بابٍ يحصلُ على 10 نقاط، وقد تطلّب الأمر 3000 خطوةٍ حتّى يحقّق البرنامجُ الحاسوبيُّ نتيجةً عالية.
عندما سمحَ الباحثون للبرنامجِ إتمام ألفِ خطوةٍ عن طريقِ خوارزميّة "TEXPLORE-VENIR"، كانتِ النّتيجةُ حصولَ البرنامج على متوسّطِ نقاطٍ بلغ 55 نقطةً خلال مرحلة اختبارٍ تتكوّن من 3000 خطوة. أمّا عندما استخدمَ البرنامج خوارزميّاتِ فضولٍ أخرى تراوحت درجاتُه خلال مرحلةِ الاختبارِ من صفر إلى 35، إلّا في حالةٍ وحيدةٍ عندما اعتمد الباحثونَ على خوارزميّةٍ تُسمّى "R-Max"، حينها حصلَ البرنامجُ على 55 نقطةٍ أيضًا.
السناريو الثّاني: كان على البرنامجِ في هذه التّجربةِ استكشافَ الأبواب والمرور عبرها في نفس الوقت. كانت نتائجُ التّجربةِ الثّانية ساحقةً لخوارزميّةِ "TEXPLORE-VENIR" بحصولها على 70 نقطةٍ مقابل 35 نقطةٍ لخوارزميّة "R-Max"، أمّا بقيّةُ الخوارزميّاتِ فقد حصلت على أقلّ من خمس نقاط.
خوارزميّةُ "TEXPLORE-VENIR" تنتقل إلى العالم الحقيقيّ:
بعد أن أثبتت هذه الخوارزميّةُ الجديدةُ قوّتها في العالمِ الافتراضيّ، نقلها الباحثون إلى العالمِ الحقيقيّ عن طريقِ برمجةِ روبوتٍ يُسمّى ناو "Nao"، وطُلبَ من هذا الرّوبوتِ بعد برمجته إداء ثلاثِ مهامّ منفصلة، بحيثُ يحصلُ على نقاطٍ معيّنةٍ كلّما أدّى مهمّةً ما.
أولى المهامُ هي ضربُ الروبوتِ على صنجٍ نحاسيّ (آلةٍ موسيقيّة)، وثاني المهامِ تمريرُ شريطٍ ورديٍّ مربوطٍ حولَ يده أمام عينيه، وثالثُ المهامّ أن يضغط الروبوتُ على زرٍّ في قدمه. احتاجَ الروبوت لكلّ واحدةٍ من المهمّات الثّلاثة مئتي خطوةٍ لكسبِ النّقاط، مع 400 خطوةٍ أولى للاستكشاف، سواءً اعتمد على البحثِ العشوائيّ أم على خوارزميّة "TEXPLORE-VENIR".
أمّا النتائج فكانت كما يلي:
أولًا: نتائجُ البحثِ العشوائيّ:
استطاعَ ناو من خلالِ البحثِ العشوائيّ؛ أي دونَ الاعتمادِ على الخوارزميّةِ الجديدةِ، أن يُمرّر الشّريطَ الورديّ أمام عينيه، ولكن خلالَ 13 تجربةٍ كانت نسبةُ النّجاحِ أقلّ من نسبة نجاح خوارزميّةِ "TEXPLORE-VENIR". أمّا في المهمّتين الأخريتين فلم يستطعِ الرّوبوت تأديتهما نهائيّا.
ثانيًا: نتائج خوارزميّة "TEXPLORE-VENIR":
ضغطَ ناو على الزرّ في سبعٍ من أصل ثلاث عشرةَ تجربةٍ بعد استخدام "TEXPLORE-VENIR"، وضربَ ناو الصّنج في واحدةٍ من خمسِ تجارب، كذلك استطاع تمريرَ الشّريطِ أمام عينيه بأفضلَ من البحث العشوائيّ.
ماذا يُمكن أن نستفيد من الروبوتات الفضوليّة؟
يُمكنُ للرّوبوتاتِ الفضوليّةِ أن تُظهرَ ذكاءاً كبيراً في كلّ مناحي الحياة؛ فمثلًا يُمكن أن تُظهرَ هذه الرّوبوتاتُ مرونةً عند إجراء الأعمالِ المنزليّة، كذلك يُمكنها أن تجعلَ عمليّاتِ التّصنيع أكثرَ كفاءةً، أو يُمكنها المساعدةُ في البحثِ عن أدويّةٍ للأمراض المُستعصيّة.
يقول هستر إنّ الخطوةَ التّالية ستكونُ تطويرَ البحث عن طريقِ استخدام الشّبكات العصبيّةِ العميقة؛ الّتي تُشبه بنيةَ الدّماغ، وذلك لجعلِ مسألةِ تحديدِ المناطقِ الجديدةِ الّتي يُمكن استكشافها تتمّ بشكلٍ أفضل. ويبقى السّؤالُ: "هل سنجدُ في المستقبلِ روبوتاتٍ يُمكنها أن تتعلّم مثل الأطفال؟".
المصدر:
هنا