هل يمكن للحواسيب أن تحلم؟
المعلوماتية >>>> عام
يعمل المهندسون بشكل أساسي على شبكاتٍ عصبونية تتألف من عشر إلى ثلاثين طبقة صُممت لتعمل كالدماغ البيولوجي. وقد بدأت هذه الشبكات بعمليات التعرف على الصور والتصنيف، إذ يقوم المهندسون بتغذية الشبكة بملايين الأمثلة التدريبية لتدريب الشبكة على «فهمِ» أجزاء معينة من صورة ما، مثل شكل السماء أو الشجرة، وقد استُخدمت هذه التقنيات بشكلٍ فعالٍ جداً في أنظمة التعرف على الوجوه والتعرف على الكلام، فكيف تتم عملية التدريب؟
عندما يقوم المهندسون بتغذية الشبكةِ بصورةٍ ما، تستخرجُ كل طبقة من الشبكة ميّزات معينة للصورة، ثم تتحدث إلى الطبقة التي تليها أيْ تنقل إليها المعلومات التي استخرجتها، إذ يزداد تعقيد الميّزات المُستخرجة كلما اتجهنا نحو الطبقة الأخيرة.
فمثلاً تبحث الطبقة الأولى من العصبونات (الوحدات الوظيفيّة في الشبكة) عن الحوافّ والزوايا. وتقوم الطبقات المتوسطة بتفسير الميزات الأساسية للصورة للبحث عن الأشكال العامة أو المكونات مثل الباب أو ورقة الشجر. في الطبقات الأخيرة، يتمُّ تجميع هذه المعطياتِ لإعطاء تفسيراتٍ كاملة. يتمّ تكرار هذه العملية في طبقات الشبكة، حيث تقوم كلّ طبقةٍ بتحديد الميّزات المفتاحيّة وعزلها حتى الوصول إلى الطبقة الأخيرة التي بدورها تتخذ قراراً بشأن ما تظهره الصورة وهنا يتمُّ تحديد «جواب» الشبكة، إذ أن فهم الشبكة لما يحدث في كل طبقة يشكّل تحدياً بحدّ ذاته، وتمثّل هذه العمليّة السابقة التعرّف على الصور.
تتم هذه العمليات بواسطة خوارزميات رياضية، ولكن ولأن عملية «تعلّم» الشبكة ليست واضحة بشكلٍ كامل، كما أنه من غير المفهوم لماذا لا تستطيع الشبكات التعرف على بعض الصور أحياناً، قاموا بعكس العملية، وذلك بأن تقوم الشبكة بإنتاج صورة من خلال تزويدها بعنصرٍ ما ثم طلب إنشاء صورة لهذا العنصر. يقوم الحاسوب بعدها بمحاولة ربطه بخصائصَ وميزاتٍ معيّنة.
من المفاجئ أن الشبكات العصبونية التي تم تدريبها على التمييز بين صورٍ مختلفة استطاعت القيامَ بهذه العملية لأنها تملك قدراً كبيراً من المعلومات اللازمة لتوليد الصور.
على سبيل المثال إذا أردنا صورةً لشوكة، يجب على الحاسب أن يدرك أنّ الميّزات التعريفيّة للشوكة هي عبارة عن سِنَّينِ إلى أربعة أسنان ومقبض، كما على الشبكة أن تتعلم تجاهل ما لا يهم مثل الحجم واللون والاتجاه. الصور التالية تم إنشاؤها بواسطة الشبكات العصبونية عندما طُلب منها خلق صورٍ لعناصر معينة مثل الموز ونجم البحر والنملة وغيرها:
Image: googleresearch.blogspot.co.uk
لم تتوقف تجارب فريق «غوغل» عند هذا الحد، فبدلاً من تحديد صفات الصورة للشبكة بشكلٍ مسبق، يمكن أيضاً جعل الشبكة العصبونية تولّد صوراً غير موجودة فعلاً، فكيف يتم ذلك؟
في هذه الحالة، تتمُّ تغذية الشبكة بصورةٍ عشوائية لتقوم بتحليل هذه الصورة، و يقوم الفريق باختيار إحدى طبقات الشبكة ويطلبُ منها تحسينَ ما تم اكتشافه في هذه الطبقة. وقد شبّه فريق «غوغل» عمليةَ التحليل هذه بمشاهدة الأطفال للسماء وتأملها ومحاولة تفسير أشكال السحب الموجودة فيها.
في هذه التجربة، يُعطي المستخدم الشبكةَ صورةً، ويقول لها: "أعطني المزيد مما ترينه في الصورة!". على سبيل المثال، إذا أُعطيت الشبكةُ صورةَ سماءٍ تحتوي على سحابة تشبه شكل الطير، ستُنتج الشبكة صورةً تحتوي على سحابة تشبه الطير أكثر، وهذا بدوره سيجعل الشبكة قادرة على التعرف على الطير بشكلٍ أقوى في المرات القادمة.
Image: googleresearch.blogspot.co.uk
وهذه صورٌ عن قرب لبعض المخلوقات الغريبة التي وجدتها الشبكة العصبونية في صورة السماء ذات الغيوم.
( تمّ تدريب هذه الشبكة غالباً على صورٍ لحيوانات، لذلك من الطبيعي أن تميل إلى تفسير الأشكال على أنها حيوانات).
Image: googleresearch.blogspot.co.uk
وكذلك يمكنُ للحواسيب أن ترى صوراً لأبنية ضمن صورة السحاب ومعابدَ ضمن الأشجار و طيوراً ضمن الأوراق. كما يظهر في هذه الصور:
Image: googleresearch.blogspot.co.uk
هذه التقنيّة التي تقوم بإنشاء صورٍ غير موجودة وكأنها من «مخيلة» الشبكة، تمّت تسميتها (Inceptionism)، ويمكنكم مشاهدة الصور كاملةً من هذا الرابط: هنا
في النهاية، قام المصمّمون بإعطاء الحاسوب الحرّيّة الكاملة في عمله الفنّيّ، فكانت القطع النهائيّة صوراً جميلةً منحدرةً من عقلٍ ميكانيكيّ وهي ما يدعوه المهندسون بـ«الأحلام». فلوحة (blank canvas) كانت ببساطة عبارةً عن نوعٍ من الضجيج، وقام الحاسوب باستخراج نماذج من هذا الضجيج وبتشكيل مشاهد الأحلام؛ صورٌ تأتي فقط من مخيّلةٍ ليس لها حدود.
Image: googleresearch.blogspot.co.uk
الجدير بالذكر أن شركة «غوغل» أتاحت برنامج DeepDream للناس على موقع GitHub الشهير لمشاركة الأكواد البرمجية، ويستطيع أي شخص تحميلَ البرنامج ووضعَ صورة ومشاهدةَ ما سيُظهره البرنامج بعد أن يقوم بتحليلِ الصورة عدة مرات ثم إنتاج صورةٍ تحوي أشياءً غير موجودة في الصورة الأصلية كما رأينا في الصور السابقة.
في كل مرة تقوم فيها بإدخال صورة ستظهر الشبكة نتائج جديدة ولا مجال للتكرار، وستعمل الشبكة على إنتاج صورٍ بناءً على اقتراحات المستخدم حول الأشياء التي «ستحلم» بها الشبكة ضمن 1000 فئةٍ من العناصر المألوفة لها، كالمركبات والحيوانات والنباتات والمباني والأماكن.
--------------------------------------------
مصدر المقال والصور:
هنا
هنا