المساعد الرقمي لمؤسس الفيسبوك JARVIS
المعلوماتية >>>> الذكاء الصنعي
ظهرَ مارك وهو يتعاملُ مع نظامِ منزلِهِ الذّكيّ الّذي أطلقَ عليه اسمَ جارفِس مُقتَبِساً هذا الاسم من فيلم Iron man مُحوِّلاً الخيالَ العلميَّ في الفيلمِ إلى حقيقة.
أرادَ مارك من هذا التّحدّي الدّخولَ إلى علم الذّكاءِ الصّنعيِّ ((Artificial intelligence(AI)، هذا العلمُ الّذي أصبحَ في الأونةِ الأخيرةِ جزءأً أساسيّاً ومهماً من علومِ الحاسب.
قامَ مارك ببناءِ نموذج بسيط من الـ AI يستطيع من خلاله التحكم بمنزله عن طريق توجيه الأوامر لهاتفه المحمول أو لجهاز الكمبيوتر مستخدماً العديدَ من تقنّيات الذّكاء الصُّنعيَ منها: معالجةُ اللّغاتِ المحكيّةِ NLP(Natural language processing)، التّعُّرفُ على الأصواتِ (speech recognition)، التَّعرُّفُ على الصّورِ وتمييزُ الوجوهِ. مستخدماً في ببناء كود جارفِس عدّةَ لغاتِ برمجةٍ منها : python، php ،objective c.
ويوضّح المخطّط التّالي مراحل بناء Jarvis:
Image: https://www.facebook.com/notes/mark-zuckerberg/building-jarvis/10154361492931634
مراحل عمل المشروع:
المرحلة الأولى من بناء جارفِس (Jarvis):
التحدّي الأوّلُ الّذي واجهه مارك هو كيفيّةُ ربطِ أجهزةِ منزله بالإنترنت ليتمَّ التّحكُّمُ بها من خلاله، على الرّغمِ من أنَّ بعض الأجهزةِ من السَّهلِ ربطُها والتّحكّمُ بها عن طريقِ الإنترنت إلّا أنّه لايزالُ هناكَ الكثيرُ من الأجهزة الّتي لاتمتلك هذه الخاصيّة ممّا اضطّره إلى القيامِ بتعديلاتٍ على بعضِ الأجهزةِ وأحياناً استبدالها.
يعتقدُ مارك أنّه على الشّركاتِ المُصنّعةِ تحديثَ منتجاتِها وتطويرَ واجهةَ البرامجِ التّطبيقيّةِ لهذه الأجهزةِ بما يتلاءمُ مع عصرِ الذّكاءِ الصّناعيِّ الّذي نعيشه.
المرحلة الثّانية وهي مرحلة ((ARTIFICIAL INTELLIGENCE(AI):
وهي المرحلةُ الأساسيّةُ في جارفِس، حيث اعتمدَ على تقنيّاتِ الذّكاءِ الصّناعيّ وهي:
- معالجة اللّغة المحكيّة ((Natural Language processing(NLp):
وهي إحدى طرقِ الذّكاءِ الصّناعيِّ للتّواصلِ مع الأنظمةِ الذّكيّةِ مثل جارفِس عن طريقِ اللّغاتِ المحكيّة والّتي هي هنا الإنكليزيّة وهي قسمان:
1- عن طريقِ الأوامرِ الكتابيّةِ: قامَ مارك بتوجيهِ الأوامرِ الكتابيّةِ لـ جارفِس عن طريقِ برنامجِ الماسنجر.
2- عن طريقِ الأوامرِ الصّوتيّةِ: قامَ مارك بتوجيهِ الأوامرِ الصّوتيّةِ لـ جارفِس عن طريقِ برنامجٍ تطبيقيٍّ أنشأهُ والّذي قامَ بدورِهِ بمعالجةِ هذه الأوامرِ وتنفيذِها.
تدرّجَت عمليّةُ تدريبِ مارك لنظامِ جارفِس من المستوى البسيطِ إلى المستوى المُعقّدِ حيث بدأت عمليّةُ التّدريبِ بـ "كلماتٍ مفتاحيّةٍ" مثل (غرفة - ضوء - تلفاز - ...) وازدادت في التّعقيدِ شيئاً فشيئاً.
لم تعتمد عمليّةُ التّدريبِ فقط على تعلُّمِ جارفِس لكلماتٍ ومصطلحاتٍ جديدةٍ إنّما اعتمدت على فهمِ المحتوى أيضاً وهو من أساسيّاتِ علمِ الذّكاءِ الصّناعيِّ فمثلاً عندما يوجّه مارك أمرَ تشغيلِ الأضواءِ في مكتبِهِ هذا يعني شيئاً مختلفاً عندما توجِّه بريسيللا زوجته الأمر نفسه، كذلكَ عندما يوجّه مارك أمراً بتشغيلِ موسيقى دونَ أن يحدّدَ نوعَها أو لِمن.
يتمُّ التّعاملُ مع أنظمةِ الذّكاءِ الصّناعيِّ مع الأوامرِ العامّةِ أكثرَ منَ المُحدّدةِ فمثلاً عندما يطلبُ مارك من جارفِس أن يقومَ بتشغيلِ موسيقى فقط دونَ تحديدٍ، هنا تأتي وظيفةُ الـ AI حيث يقومُ وبناءً على معطياتٍ سابقةٍ لديهِ بتشغيلِ الموسيقى الملائمةِ مثلاً عندما يطلب مارك تشغيلَ أغنيةٍ ويقومُ جارفِس باختيارٍ خاطىءٍ يخبره مارك أنَّه يريدُ سماعَ أغنيةٍ كلاسيكيّةٍ فيقومُ جارفِس بتشغيلِ أغنيةٍ أخرى كلاسيكيّةٍ وتحديثِ بياناته بـأنَّ مارك يفضّلُ في هذا الوقتِ الاستماعَ إلى الموسيقى الكلاسيكيّةِ ومع مرورِ الوقتِ وزيادةِ الأوامرِ وعددِ مرّاتِ التّدريبِ عندما يطلب مارك تشغيلَ أغنيةٍ يستطيعُ جارفِس أن يحدِّدَ نوعها دونَ أن يذكرَ مارك ذلك.
- الرّؤية والتّعرّفُ على الوجوهِ والأشخاصِ VISION AND FACE RECOGNITION:
حوالي ثلث الدّماغِ البشريِّ مخصّصٌ لعمليّةِ الرّؤية ولا تزالُ هناك بعض المشاكلِ الّتي يواجهها علم الذّكاءِ الصّناعيِّ في هذا المجالِ منها عمليّةُ الملاحقةِ إذا كان الجسمُ متحرّكاً وعمليّةُ التّعرّفِ على الأشخاصِ.
إنَّ عمليّةَ التَّعرُّفِ على الأشخاصِ هي الأصعبُ في تمييزِ الأشياءِ، لأنَّ البشرَ جميعًهم متشابهون نسبيّاً.
استعان مارك بإمكانيّاتِ الفيسبوك المتقدّمةِ في تقنيّةِ التَّعرُّفِ على الأشخاصِ في نظامِ جارفِس قام مارك بتثبيتِ عدّةِ كاميراتِ مراقبةٍ في أماكنَ مختلفةٍ وبزوايا مختلفةٍ تلتقطُ عدّةَ صورٍ ومن زوايا مختلفةٍ بحيثُ تضمن الرّؤية الكاملة للوجه وربطِ هذه الكاميراتِ مع عددٍ من الخوادمِ.
Image: https://www.facebook.com/notes/mark-zuckerberg/building-jarvis/10154361492931634
ترسلُ الكاميراتُ الصّورَ على الخوادمِ والّتي بدورِها تقومُ بعمليّةِ المعالجةِ والّتي تتمُّ على مرحلَتين:
1- المرحلةُ الأولى: وهي تحديدُ فيما إذا كانت الصّورُ المُلتَقَطةُ تحوي على وجوهٍ.
2- المرحلةُ الثّانية: وهي مرحلةُ التَّعرُّفِ على هذهِ الوجوه لتحديدِ هويّةِ الشّخصِ.
لم يقتصر نظامُ الرّؤيةِ وتمييزِ الصّورِ لدى جارفِس فقط خارجَ المنزلِ بل إنّه أيضاً يعملُ داخلَ المنزلِ، مثلاً: تحديدُ أيّ غرفةٍ موجودٌ فيها مارك فيقومُ بتشغيلِ الأضواءِ أو إخبارُ مارك بأنَّ طفلَه قد استيقظ … إلخ.
أرادَ مارك لنظامِ جارفِس أن يكونَ ذو فائدةٍ عامّةٍ فلا يقتصرُ استعمالُه عندما يكونُ متواجداٌ فقط داخلَ المنزلِ بل أرادَ أن يكونَ على اتصالٍ معهُ خارجَ المنزلِ أيضاً.
بالرّغمِ من أنَّ برنامجَ التَّحكُّمِ بـ جارفِس موجودٌ على حاسوبه في المنزلِ إلّا أنّ مارك أرادَ أن يتمَّ التّواصلُ عن بُعْدٍ أيضاُ عن طريقِ الهاتفِ بحيثُ يمكنه التّواصلَ مع جارفِس من أيِّ مكانٍ يريد، فمثلاً عند وصولِ شخصٍ ما إلى المنزلِ بإمكانِ جارفِس إخبارُ مارك من هو الشّخصُ إن أمكنَ التَّعرُّفُ عليه.
لم يقم مارك ببناءِ برنامجٍ جديدٍ للهاتفِ بل استخدمَ برنامجَ الماسينجرِ الموجودُ أصلاً لديه حيث كان هذا أسهلُ من بناءِ تطبيقٍ جديدٍ بالإضافةِ إلى المميّزاتِ الّتي يملكها برنامجُ الماسينجر منها أنَّه يعملُ على أشهرِ أنظمةِ التّشغيلِ للهواتفِ المحمولةِ (Android & IOS) بالإضافةِ إلى أنَّ البرنامجَ يدعمُ النُّصوصَ والصُّورَ وملفّاتِ الصّوتِ والفيديو وإدارةِ السّماحيّات.
استطاع مارك إرسالَ الرّسائلِ النّصيّةِ إلى جارفِس والّذي بدورِهِ يُعيدُ إرسالَها إلى الخادِمِ الخاصِ بـ جارفِس ليقومَ بمعالجتِها وتنفيذِ الأوامرِ.
فضّلَ مارك التّواصلَ مع جارفِس عن طريقِ الأوامرِ الكتابيّةِ أكثرَ من الأوامرِ الصّوتيّةِ فهو يرى ذلك ملائماً أكثرَ، ويقولُ مارك أنَّ منتجاتِ الذّكاءِ الصّناعيِّ المستقبليّةِ لا يجبُ أن تهتمَّ فقط بالصّوتِ بل يجبُ عليها التّركيزُ على النّصوصِ والأوامرِ الكتابيّةِ أيضاً.
Image: https://docs.google.com/document/d/1_Guj3nmOC275ACyEhh6d2I2Yx0BZVqyWdzZ2cragOtI/edit
- الصّوت والتّعرّف على الكلامِ Voice AND Speech Recognition:
بالرّغمَ من أنّ مارك يعتقدُ أنّ الأوامرَ الكتابيّةَ ستكونُ أكثرَ فائدةً بالتّواصلِ مع تطبيقاتِ الذّكاءِ الصِّناعيِّ لا تزالُ الأوامرُ الصّوتيّةُ من الأهميّةِ بمكان.
لم يستطع مارك استخدامَ برنامجِ الماسينجر في تمييزِ الأصواتِ والتّعرّفِ عليها فاضطرَ إلى برمجةِ تطبيقٍ خاصٍ لفهمِ الأوامرِ الصّوتيّةِ وتنفيذِها،كما قامَ بوضعِ جهازِ هاتفٍ في كلِّ غرفةٍ ممّا أمكنَهُ من التّواصلِ مع جارفِس من أيِّ مكانٍ في المنزلِ بشكلٍ مشابهٍ تقريباً لنظامِ ECHO الّذي أطلقته شركةُ AMAZON ومع امتلاكِ الهاتفِ والتّطبيقِ تمكّنَ مارك أيضاً من التّواصلِ مع جارفيس خارجِ المنزل أيضاً.
قامَ مارك بتصميمِ البرنامجِ للهواتفِ الّتي تعملُ بنظامِ IOS ولكن في المستقبل يقول مارك أنّه سوف يقومُ ببرمجةِ آخرَ من أجلِ أجهزةِ الـ ANDROID.
Image: https://www.facebook.com/notes/mark-zuckerberg/building-jarvis/10154361492931634
على الرّغمِ من التّطوُّرِ والتّقدُّمِ الكبيرِ في علمِ الذَّكاءِ الصّناعيِّ والتّعرُّف على الأصواتِ وتمييزها ولكن لاتزال هناك محدوديّةٌ في مجالِ التّعرُّفِ على الكلامِ وفي أنظمةِ تعليمِ الآلةِ بشكلٍ عام.
أحدُ أهمِّ العقباتِ في أنظمةِ التَّعرُّفِ على الصّوتِ (أو بشكلٍ عامٍ أنظمةُ تعلُّمِ الآلةِ) هي أنّها مُخصَّصةٌ ومقيّدةٌ وليست كما يتصوّرُها النّاس فعلى سبيلِ المثال التَّعرُّف على كلامِ شخصٍ يقومُ بتوجيهِ الأوامرِ إلى الحاسبِ أو الهاتفِ يختلفُ بشكلٍ كاملٍ عن عمليّةِ التَّعرُّفِ على كلامِ شخصَينِ يتحدَّثانِ مع بعضِهما أي أنَّه في حالِ قمتَ بتدريبِ نظامِ ذكاءِ صناعيّ على بياناتٍ مأخوذةٍ من غوغلِ لأشخاصٍ يتكلّمون ويعطونَ أوامرَ لمحركِ البّحثِ وحاولت تطبيقها على محادثةٍ بين شخصَين على الفيسبوك فسوفَ تكونُ النّتائجَ ِسيّئةً.
بالنّسبةِ لـ جارفِس، فإنّ تدريبَ نظامِ ذكاءٍ صناعيٍّ لاستقبالِ الأوامرِ من الأشخاصِ ضمنَ مسافاتٍ صغيرةٍ يختلفُ عن تدريبِ النّظامِ بشكلٍ عامٍ على امتدادِ كاملِ مساحةِ الغرفةِ أو المنزلِ كنظامِ ECHO من شركةِ AMAZON هذه الأنظمةُ تخصصيّةٌ أكثرَ ممّا يبدو وتعملُ ضمنَ شروطٍ معيّنةٍ وهذا يدلُّ على أنّنا لا نزالُ بعيدينَ عن امتلاكِ نظامٍ عامٍ يعملُ في جميعِ الظّروفِ.
على المستوى العاطفيِّ يُظهِرُ مارك البعدَ العاطفيًّ عند التّعاملِ مع جارفِس عن طريقِ استخدامِ الرّموزِ التّعبيريّةِ إذا كان التّواصلُ عن طريقِ الرّسائلِ النّصيّةِ ويقومُ جارفِس بردِّ الفعلِ المناسبِ (فرحٌ أو دعابةٌ … إلخ).
هناكَ الكثيرُ من الأشياءِ ليتمَّ اكتشافها وتطويرها في مجال التَّعرُّفِ على الأصواتِ ولكنَّ التّكنولوجيا الّتي وصلنا إليها حتّى يومنا هذا جيدةٌ بما يكفي لبناءِ نظامٍ كـ جارفِس وفي السّنواتِ المقبلةِ سوف نحصل على أنظمةٍ، أفضلُ هذهِ الأنظمةِ من وجهةِ نظرِ مارك هي الّتي لا تكونُ محدودةً بمكانٍ معيّنٍ ويمكنكَ التّواصلُ معها في أيِّ مكانٍ.
تقتربُ أنظمةُ الذّكاءِ الصّناعيّ أن تكونَ قادرةً على القيامِ بالعديدِ من المهامِ تفوقُ توقّعاتِ البشرِ مثلَ السّيّاراتِ ذاتيّةِ القيادةِ وأنظمةِ الكشفِ المبكّرِ عن الأمراضِ وأنظمةِ استكشافِ الكواكبِ .... إلخ، وهذه الأمورُ مجتمعةً سيكون لها تأثيرٌ كبيرٌ على العالمِ، ولكن بالرّغمِ من كلِّ ذلك لا نزالُ حتّى الآنَ نكتشفُ المعنى الحقيقيَّ للذَّكاء.
رابط الفيديو: هنا
--------------------------------------------------------------------
المصدر:
هنا