المعلوماتية > الذكاء الصنعي

تقنيّة فيسبوك للبحث داخلَ محتوياتِ الصّور

استمع على ساوندكلاود 🎧

تمّ استخدامُها أوليّاً لتحسينِ تجربةِ مُستخدمي الفيسبوك ضعيفي البصر، إنّها منصّةُ الرّؤيةِ الحاسوبيّةِ (computer vision platform) الخاصّةِ بشركةِ فيسبوك والمَدعوّةَ بـ لوموس Lumos والّتي باتت تُستخدَمُ لتقويةِ البحثِ في محتوى الصّورِ لجميعِ المستخدمين. هذا يعني أنَّه باتَ باستطاعتِنا البحثُ عن الصّورِ باستخدامِ كلماتٍ مفتاحيّةٍ تصفُ محتوياتِ الصّورةِ، وذلكَ عوضاً عن الاكتفاءِ باستخدامِ الوسوم (tags) والتّسمياتِ التّوضيحيّةِ (captions).

لإتمامِ المهمّةِ، قامت شركةُ فيسبوك بتدريبِ شبكةٍ عصبيّةٍ عميقةٍ حديثةِ الطّرازِ باستخدامِ عشراتِ الملايينِ من الصّورِ. شركةُ فيسبوك محظوظةٌ في هذا الصَّدَدِ كونُ مِنَصَّتِها تتضمَّنُ البلايينَ من الصّورِ الّتي تحتوي على التّسمياتِ التّوضيحيّةِ (captions) بالأساس. بشكلٍ أساسيٍّ، تقومُ المنصّةُ بمطابقةِ كلماتِ البحثِ مع الخصائصِ المُمَيِّزةِ للصّورِ بدرجةٍ احتماليّةٍ مُعيّنةٍ.

بعد مطابقةِ كلماتِ البحثِ بالصّورِ المطلوبةِ، تقومُ المنصّةُ بتصنيفِ النّواتجَ مُستخدِمَةً المعلوماتِ من كِلا الصّورِ والبحثِ الأصليِّ معاً. بالإضافةِ إلى ذلك، قامت شركةُ فيسبوك بإضافةِ بعض الحدودِ بسببِ التَّنوُّعِ الكبيرِ في الصّورِ، وذلك من أجل أن لا ينتهيَ المطافُ بنا مع ٥٠ صورةً لنفسِ الشّيئ مع بعضِ الاختلافِ في الزّاويةِ والحجمِ. عمليّاً، ستقومُ هذه التّحسيناتُ بإعطاءِ نتائجَ مُرضيةً ومُتعلِّقَةً بموضوعِ البحثِ.

وفي المُحصّلةِ، ستقومُ شركةُ فيسبوك بتطبيقِ هذه التّقنيّة على مجموعةِ الفيديوهات المتزايدةِ الخاصّةِ بها. ويمكنُ استخدامُ هذه التّقنيّةُ سواءً في سياقٍ شخصيٍّ للبحثِ كأن يبحثَ أحدُهُم في فيديو إحدى الصّديقاتِ لإيجادِ اللّحظةِ الّتي أطفأت فيها شموعُ كعكةِ عيد ميلادِها، أو حتّى في السّياقِ الإعلانيِّ. ويمكن لهذه التّقنيّةُ أن ترفعَ سقفَ الإيراداتِ المُحتَمَلَةِ للشّركةِ.

ويُوّفِرُ سحبَ المحتوى من الصّورِ والفيديوهاتِ قوةً مُوجَّهةً لتحسينِ إيجادِ الأهدافِ المطلوبةِ. ففي نهايةِ الأمرِ، سيكونُ من الجيّدِ أن نرى نِظاماً مُتكامِلاً يسمحُ للأشخاصِ بإيجادِ المعلوماتِ. على سبيلِ المثالِ: يمكننا البحثُ عن قطعةِ ملابسَ أعجبتنا في فيديو معيّن، ومن ثمَّ إيجادُ مثيلٍ لها في السّوقِ.

استخدام لوموس Lumos لمساعدةِ الأشخاصِ ضعيفي البصر

بالإضافة إلى خاصيّةِ البحثِ في محتوى الصّورِ، تقومُ شركةُ فيسبوك الآنَ بتطويرِ أداةِ النَّصِّ التّلقائيِّ البديلِ (Automatic Alternative Text tool) الخاصَّة بها. عندما قامت فيسبوك بإطلاقِ الأداةِ في شهرِ نَيسان 2016، استطاعَ الُمستخدمون ضعيفو البصرِ الاستفادةَ من أداةِ تحويلِ النَّصِّ إلى كلامٍ لفهمِ محتوى الصّورِ لأوَّلِ مرَّةٍ. حيثُ استطاعَ النّظامُ إخبارَ المستخدمِ بأنَّ الصُّورةَ تحتوي مثلاً على مسرحٍ وأضواءٍ؛ ولكنّه لم يكن ذا كفاءةٍ عاليةٍ ليربُطَ الأحداثَ بالأشياءِ.

ولكن قامَ فريقٌ من شركة فيسبوك بإصلاحِ المشكلةِ عن طريقِ تصنيفِ 130،000 صورةٍ موجودةٍ في المنصّةِ. كما قامت الشّركةُ بتدريبِ نموذجِ رؤيةٍ حاسوبيّةٍ (computer vision model) للتَّعرُّفِ على الأحداثِ الّتي تحصَلُ في الصّورةِ. يمكنك الآنَ مثلاً سماعُ عبارةٍ كـ"أشخاصٍ يرقُصونَ على المسرحِ"؛ يمكنُ القولَ بأنَّ هذا الشَّرحَ أفضلٌ ومرتبطٌ بالسّياقِ بشكلٍ أكبرَ.

سباقُ الرّؤيةِ الحاسوبيّةِ التّطبيقيِّ

فيسبوك ليست الشّركةَ الوحيدةَ الّتي تتسابقُ من أجلِ تطبيقِ تقنّياتِ الرّؤيةِ الحاسوبيّةِ (computer vision) المتقدّمةِ على المُنتجاتِ القديمةِ، حيث قام مطوّرو موقع Pinterest بتطويرِ الموقعِ ليَسمَحَ للمستخدمينَ بالبحثِ عن الصّورِ باستخدامِ الأشياءِ الموجودةِ فيها. هذه التّقنيّةُ تجعلُ الصّورَ تفاعليّةً، ولكن الأهمُّ أنَّها تُسهِّلُ عمليّةَ تسويقِ الصّورِ.

في المقابل، قامت شركةُ غوغل بنشرِ نموذجِها الخاصّ في خريفِ عام 2016، وذلك عبرَ إضافةِ التّسمياتِ التّوضيحيّةِ (captions) بصيغةٍ مفتوحةِ المصدر (open source)، والّذي يمكنُهُ التَّعرًّفَ على الأشياءِ وتصنيفِ الأحداثِ بدقَّةٍ تصلُ إلى 90 بالمئة. كما ساعدَ العملُ على المكتبةِ البرمجيّةِ المُسمّاةِ بِـ TensorFlow بإعطاءِ الشُّهرةِ للنّموذجِ، وأصبحَ معروفاً بين مطوّري التَّعلُّمِ الآليّ (machine learning).

شركةُ فيسبوك مُصمِّمةٌ على جعلِ التَّعلُّمِ الآليِّ (machine learning) سهلاً على فرق الشّركةِ جمعاء لتُمكّنَهم من دمجِ التّقنيّةِ بالمشاريعِ الخاصّةِ بهم. هذا يعني تطويرُ استخدامِ منصّةِ الشّركةِ المُسمَّاةِ بـ FBLearner Flow.

"نقومُ الآنَ بتطبيقِ مليونِ تجربةِ ذكاءٍ صُنعيٍّ شهريّاً على منصةِ FBLearner Flow. هذا أكثرُ بستةِ مرّاتٍ ممّا كنّا نقومُ به في العامِ الماضي" قالت Joaquin Quiñonero Candela مديرةُ فيسبوك للتَّعلُّمِ الآليِّ التّطبيقيِّ (applied machine learning).

تمَّ بناءُ منصّةِ لوموس Lumos باستخدامِ منصّةِ FBLearner Flow. حيث تمَّ استخدامُها لأكثرَ من مئتي نموذجٍ بصريٍّ (visual models). وبالإضافةِ إلى البحثِ عن محتوى الصُّورِ، قام المهندسونَ باستخداِمها لمحاربةِ الرّسائلَ البريديّةَ المؤذيةَ (spam).

---------------------------------------------------------------

المصدر:

هنا