ما الذي يوجد داخل الصورة؟ الإنسان يسـأل والحاسوب يجيب!

تنتشر تطبيقات الذكاء الصنعيّ لتشمل العديد من المجالات في حياتنا، وتحتلّ معالجةُ الصور قسطاً وافراً من مجالات البحث فيه.
لقد تجاوز الذكاء الصنعيّ عدّة مراحل في عمليّة التعرّف على محتوى صورة، إذ كانت الحواسيب سابقاً قادرةً على إعطاء صورةٍ لأيّ شيءٍ أو شخصٍ محدّد بمجرّد ذكر اسمه.
اليوم وبفضل الأبحاث الجديدة، أصبحت الحواسيب قادرةً على الإجابة على أسئلةٍ أكثرَ تعقيداً، مثلاً: "ما الذي يوجد على العشب عدا الشخص الموجود في الصورة؟".

Image: www.bloomberg.com

نُشِرت ورقةٍ بحثيًة في جامعة «كورنيل»، عُرِضَ فيها نظامٌ قادرٌ على تعلّم تحديدِ الملامح البصريّة المميّزة في الصورة والكلمات المرتبطة بها، ثمّ يقوم بجمع الاثنين معاً في قاموسٍ داخلَ دماغه الرقميّ، ليقوم باستخدامها بعد ذلك للإجابة على أسئلةٍ حول صورٍ لم يشاهدها مسبقاً.

قامت شركة "Bloomberg" بوضع هذا النظام تحت اختبارها الخاص، إذا قامت بأخذِ صورة لحبةِ حمضيّات موضوعةً في راحة اليد، وأُرسلت الصورة للنظام مرفقةً بالسؤال: " ما الذي يوجد في منتصف اليد؟"
فكان جواب النظام: «برتقالة». ( لكن في الحقيقة هي تدعى «ساتسوما»، إحدى أنواع الحمضيّات الشبيهة بالبرتقال).

Image: www.bloomberg.com

قد يبدو هذا التطوّر صغيراً، لكنّ تعليم الحواسيب أن تميّز الموجودَ داخل الصور وأن تربط ذلك بمصطلحاتٍ لغويّة أمرٌ صعبٌ للغاية. يستند هذا البحث على عدّة تخصّصاتٍ مختلفةٍ بدأت مؤخّراً بالتلاقي.
ستقرّبنا التطوّرات القادمة في هذا المجال إلى اليوم الذي نكون فيه قادرين على أن نطلب من محرّك البحث «غوغل» أو «بايدو» أن يبحث لنا ضمن ملايين الصور، وأن يجد صوراً بمواصفات معينة مثل صورة تتضمنُ سيارة «فولكسفاغن» بإطارٍ مثقوبٍ، أو صورة تحوي سبعَ برتقالاتٍ ضمن وعاء!
هذا التقدّم الحاصل من شركة «بايدو» وجامعة كاليفورنيا- وعلى الرّغم من أهمّيّته - يبقى بعيداً عن الكمال، فالنظام غير قادرٍ على معالجة عدّة أسئلة معاً، فمثلاً لا نستطيع سؤاله عن أنواع الفاكهة الموجودة في الوعاء، ثمّ سؤاله عن عدد التفاحات الموجودة.
كانت نسبة الإجابات الصحيحة في الاختبارات 67.4%، في حين قام الأفراد بتقديم إجاباتٍ صحيحة بنسبة بلغت 94.8%.
يقول أحد الباحثين القائمين على النظام: " النظامُ غيرُ جاهزٍ في الوقت الراهن لوضعه ضمن تطبيقات جدّيّة وحقيقيّة، بسبب وجود بعض الأخطاء". لكنّ أموراً كهذه في مجال الذكاء الصنعيّ تتمّ معالجتها سريعاً، فمنذ ظهور التحدّي الكبير في مجال التعرّف على الصورة المسمّى "Imagenet" في عام 2010، انخفضت نسبةُ الخطأ في تمييز الصورة بمقدار أربعة أضعاف.
وفي عملٍ مشتركٍ بين جامعة كاليفورنيا واثنتين من الشركات الناشئة، والذي يركّز على تحليل أشرطة المراقبة، سيصبح الذكاء الصنعيّ يوماً ما قادرأ على رصد لقطات الكاميرات الأمنيّة لمعرفة واكتشاف الشاحنات التي لا تحمل علامات مرور، والتي تقف خارج البنك لمدّةٍ تتجاوز الأربع ساعاتٍ دون أن تتحرّك.

يقول أحد الباحثين في شركة «بايدو»: " في المستقبل ستكون التطبيقات المحتملة تعليميّة وتتضمّن البحث عن الصور". فالذكاء الصنعيّ قادرٌ على تلبية احتياجات الطلاب؛ على سبيل المثال يمكن اختبار الطالب عبر سؤاله عن أنواع الحيوانات الموجودة في الصورة التي التقطها والده في رحلة نهاية الأسبوع إلى حديقة الحيوانات.
قطعت الحواسيب في هذا البحث شوطاً كبيراً، إذ تستطيعُ الآن أن تعرض أحد الكتب على الحاسوب وسيردّ عليك: " على غلاف هذا الكتاب يوجد قطّ يرتدي قبّعةً مخطّطةً باللونين الأحمر والأبيض".
وما هذه إلّا بداية الطريق الذي يمهده لنا الذكاء الصنعيّ نحو حياةٍ أفضل!
---------------------

المصدر:
هنا

الورقة البحثية:
هنا

ما الذي يوجد داخل الصورة؟ الإنسان يسـأل والحاسوب يجيب!

المعلوماتية >>>> عام

المساهمون في الإعداد

استمع لمقال عشوائي

من أعد المقال؟

مواضيع مرتبطة

التعلّم العميق (Deep Learning)

وشوم مؤقتة للاستشعار من خلال الجلد!

استخدام قنوات الـFM الراديوية في تحسين اتصال الإنترنت

كيف تعمل منصّة Google السحابية؟

الشهادات الأعلى أجرًا في تقنية المعلومات

تحطيم الرقم القياسي العالمي في سرعة نقل البيانات بمعدل 43 تيرا بت/بالثانية

المنهجيـّات الـمُـتّـبعة لتوفيرِ المخدّمات الافتراضية

كيف يمكن للدماغ البشري التعامل مع البيانات الكثيرة؟

أساسيات الشبكة

2 نموذج الشلال

ما الذي يوجد داخل الصورة؟ الإنسان يسـأل والحاسوب يجيب!

المعلوماتية >>>> عام

مواضيع مرتبطة إضافية المزيد >

شارك

تفاصيل

المساهمون في الإعداد

استمع لمقال عشوائي

من أعد المقال؟

مواضيع مرتبطة

التعلّم العميق (Deep Learning)

وشوم مؤقتة للاستشعار من خلال الجلد!

استخدام قنوات الـFM الراديوية في تحسين اتصال الإنترنت

كيف تعمل منصّة Google السحابية؟

الشهادات الأعلى أجرًا في تقنية المعلومات

تحطيم الرقم القياسي العالمي في سرعة نقل البيانات بمعدل 43 تيرا بت/بالثانية

المنهجيـّات الـمُـتّـبعة لتوفيرِ المخدّمات الافتراضية

كيف يمكن للدماغ البشري التعامل مع البيانات الكثيرة؟

أساسيات الشبكة

2 نموذج الشلال

مواضيع مرتبطة إضافية
المزيد >