المعلوماتية > عام

ما الذي يوجد داخل الصورة؟ الإنسان يسـأل والحاسوب يجيب!

تنتشر تطبيقات الذكاء الصنعيّ لتشمل العديد من المجالات في حياتنا، وتحتلّ معالجةُ الصور قسطاً وافراً من مجالات البحث فيه.

لقد تجاوز الذكاء الصنعيّ عدّة مراحل في عمليّة التعرّف على محتوى صورة، إذ كانت الحواسيب سابقاً قادرةً على إعطاء صورةٍ لأيّ شيءٍ أو شخصٍ محدّد بمجرّد ذكر اسمه.

اليوم وبفضل الأبحاث الجديدة، أصبحت الحواسيب قادرةً على الإجابة على أسئلةٍ أكثرَ تعقيداً، مثلاً: "ما الذي يوجد على العشب عدا الشخص الموجود في الصورة؟".

نُشِرت ورقةٍ بحثيًة في جامعة «كورنيل»، عُرِضَ فيها نظامٌ قادرٌ على تعلّم تحديدِ الملامح البصريّة المميّزة في الصورة والكلمات المرتبطة بها، ثمّ يقوم بجمع الاثنين معاً في قاموسٍ داخلَ دماغه الرقميّ، ليقوم باستخدامها بعد ذلك للإجابة على أسئلةٍ حول صورٍ لم يشاهدها مسبقاً.

قامت شركة "Bloomberg" بوضع هذا النظام تحت اختبارها الخاص، إذا قامت بأخذِ صورة لحبةِ حمضيّات موضوعةً في راحة اليد، وأُرسلت الصورة للنظام مرفقةً بالسؤال: " ما الذي يوجد في منتصف اليد؟"

فكان جواب النظام: «برتقالة». ( لكن في الحقيقة هي تدعى «ساتسوما»، إحدى أنواع الحمضيّات الشبيهة بالبرتقال).

قد يبدو هذا التطوّر صغيراً، لكنّ تعليم الحواسيب أن تميّز الموجودَ داخل الصور وأن تربط ذلك بمصطلحاتٍ لغويّة أمرٌ صعبٌ للغاية. يستند هذا البحث على عدّة تخصّصاتٍ مختلفةٍ بدأت مؤخّراً بالتلاقي.

ستقرّبنا التطوّرات القادمة في هذا المجال إلى اليوم الذي نكون فيه قادرين على أن نطلب من محرّك البحث «غوغل» أو «بايدو» أن يبحث لنا ضمن ملايين الصور، وأن يجد صوراً بمواصفات معينة مثل صورة تتضمنُ سيارة «فولكسفاغن» بإطارٍ مثقوبٍ، أو صورة تحوي سبعَ برتقالاتٍ ضمن وعاء!

هذا التقدّم الحاصل من شركة «بايدو» وجامعة كاليفورنيا- وعلى الرّغم من أهمّيّته - يبقى بعيداً عن الكمال، فالنظام غير قادرٍ على معالجة عدّة أسئلة معاً، فمثلاً لا نستطيع سؤاله عن أنواع الفاكهة الموجودة في الوعاء، ثمّ سؤاله عن عدد التفاحات الموجودة.

كانت نسبة الإجابات الصحيحة في الاختبارات 67.4%، في حين قام الأفراد بتقديم إجاباتٍ صحيحة بنسبة بلغت 94.8%.

يقول أحد الباحثين القائمين على النظام: " النظامُ غيرُ جاهزٍ في الوقت الراهن لوضعه ضمن تطبيقات جدّيّة وحقيقيّة، بسبب وجود بعض الأخطاء". لكنّ أموراً كهذه في مجال الذكاء الصنعيّ تتمّ معالجتها سريعاً، فمنذ ظهور التحدّي الكبير في مجال التعرّف على الصورة المسمّى "Imagenet" في عام 2010، انخفضت نسبةُ الخطأ في تمييز الصورة بمقدار أربعة أضعاف.

وفي عملٍ مشتركٍ بين جامعة كاليفورنيا واثنتين من الشركات الناشئة، والذي يركّز على تحليل أشرطة المراقبة، سيصبح الذكاء الصنعيّ يوماً ما قادرأ على رصد لقطات الكاميرات الأمنيّة لمعرفة واكتشاف الشاحنات التي لا تحمل علامات مرور، والتي تقف خارج البنك لمدّةٍ تتجاوز الأربع ساعاتٍ دون أن تتحرّك.

يقول أحد الباحثين في شركة «بايدو»: " في المستقبل ستكون التطبيقات المحتملة تعليميّة وتتضمّن البحث عن الصور". فالذكاء الصنعيّ قادرٌ على تلبية احتياجات الطلاب؛ على سبيل المثال يمكن اختبار الطالب عبر سؤاله عن أنواع الحيوانات الموجودة في الصورة التي التقطها والده في رحلة نهاية الأسبوع إلى حديقة الحيوانات.

قطعت الحواسيب في هذا البحث شوطاً كبيراً، إذ تستطيعُ الآن أن تعرض أحد الكتب على الحاسوب وسيردّ عليك: " على غلاف هذا الكتاب يوجد قطّ يرتدي قبّعةً مخطّطةً باللونين الأحمر والأبيض".

وما هذه إلّا بداية الطريق الذي يمهده لنا الذكاء الصنعيّ نحو حياةٍ أفضل!

---------------------

المصدر:

هنا

الورقة البحثية:

هنا