المعلوماتية > الذكاء الصنعي

التعلّم العميق (Deep Learning)

استمع على ساوندكلاود 🎧

كثيراً ما نسمع بما يسمى بـ«التعلّم العميق» وخصوصاً إن كنّا من المهتمّين بالذكاء الصنعي وتطبيقاته. فما هو هذا التعلّم؟ ولماذا سمّي بالعميق؟ ومتى ظهر؟ وكيف تمّ تطبيقه؟ لنتعرّف إلى كلّ ذلك في هذا المقال.

تعريف التعلّم العميق:

ظهر التعلم العميق (ويسمى أيضاً التعلم عميق البنية أو التعلّم الهرمي) منذ عام 2006 كمجالٍ جديد ضمن بحوث تعلّم الآلة (Machine Learning)، وقد تطورت تقنياتُ التعلم العميق البحثية خلال السنوات الماضية وأثّرت على مجالٍ واسع من العمل على معالجة الإشارة والمعلومات بشكليها التقليدي والحديث وذلك ضمن المجالات المتّسعة المتضمّنة المفاهيم الأساسية لتعلّم الآلة والذكاء الصنعي. وقد وجدت عدّة تعاريف للتعلّم العميق وهي:

1- صف من تقنيات تعلّم الآلة التي تستخدم عدّة طبقات من المعالجة غير الخطية للمعلومات لاستخراج ونقل الخواص بإشراف أو بدون إشراف بالإضافة لتحليل وتصنيف الأنماط.

2- حقل فرعي ضمن تعلّم الآلة، يُطبق خوارزميات التعلم على تمثيل متعدد المستويات، وذلك من أجل نمذجة العلاقات المعقدة ضمن المعطيات، وبذلك يتم تعريفُ السِّمات والمفاهيم العالية المستوى بناءً على ماهو أدنى منها (فالسيارة مثلاً تُعرف بأجزائها، والدولاب يُعرف بأجزائه وهكذا)، تدعى هذه البنية الهرمية من السمات بالبنية العميقة، كما وتعتمد مُعظم هذه النماذج على منهجية التعلم بدون إشراف (معلم) للتمثيلات.

3- حقلٌ فرعي ضمن تعلّم الآلة يعتمدُ على تعلّم عدّة مستويات من التمثيلات المقابلة لبنيةٍ هرمية من السمات أو العوامل أو المفاهيم، ويتم تعريفُ السِّمات والمفاهيم عالية المستوى بالاعتماد على المفاهيم ذات المستوى الأدنى، وقد تساعد مفاهيم المستوى الأدنى ذاتها في تعريف العديد من مفاهيم المستوى الأعلى. التعلّم العميق هو جزءٌ من عائلة أكبر من طرائق تعلّم الآلة المعتمدة على تعلّم التمثيلات. فمن الممكن تمثيل صورة ما بعدّة طرق (كشعاعٍ من البكسلات مثلاً)، لكن توجد بعض التمثيلات التي تجعل تعلّم المهام أكثر سهولة (هل هذه الصورة تمثّل وجه إنسان مثلاً؟). إن مجال البحث الذي يهتم بإيجاد وتعريف هذه التمثيلات وكيفية تعليمها هو ما يُطلق عليه التعلم العميق.

4- مجموعة من خوارزميات تعلّم الآلة التي تحاول أن تتعلمَ في عدّة مستويات مقابلة لمثلها من التجريد، ويستعمل التعلّم العميق الشبكات العصبونية الصنعية. وتتوافق المستويات في هذه النماذج التعلّمية الإحصائية مع مستويات مختلفة من المفاهيم حيث يتم تعريف المفاهيم عالية المستوى بالاعتماد على المفاهيم ذات المستوى الأدنى وقد تساعد مفاهيم المستوى الأدنى ذاتها في تعريف العديد من مفاهيم المستوى الأعلى.

5- مجالٌ جديد ضمن بحوث تعلّم الآلة لتقريب تعلّم الآلة باتجاه واحدٍ من أهدافه الأساسية وهو الذكاء الصنعي، ويدور حول تعليم مستويات متعددة من التمثيل والتجريد ممّا يساعد في تحقيق فهمٍ أكبر للمعطيات كالصور، الفيديو والنصوص.

ونلاحظ من التعاريف السابقة وجود مفهومين أساسيين مشتركين وهما:

1- وجود نماذج مؤلفة من عدة مستويات من المعالجة غير الخطية للمعلومات.

2- طرائق تعلّم تمثيل لسمات - بإشراف أو بدون إشراف - أكثر تجريداً في المستويات الأعلى.

يقع التعلّم العميق في المنطقة المشتركة ما بين عدّة مجالات وهي بحوث الشبكات العصبونية والذكاء الصنعي والنمذجة الرسومية والأمثلية والتعرّف على الأنماط ومعالجة الإشارات. وهناك ثلاثة أسباب وراء انتشار التعلّم العميق وشيوعه وهي:

1- القدرات المتزايدة لمعالجة الرقاقات كوحدات المعالجة الرسومية عامة الأغراض general-purpose graphical processing units (GPGPUs).

2- الحجم المتزايد للمعطيات المستخدمة في التدريب.

3- التقدّم الحديث في تعلّم الآلة ومعالجة الإشارة والمعلومات.

وقد سمحت هذه التطوراتُ الأخيرة لوسائل التعلّم العميق باستعمال التوابع المعقّدة المركّبة غير الخطية من أجل تعلّم تمثيلات الخواص الموزّعة والهرمية، وتحقيق الاستعمال الفعّال للمعطيات المصنّفة وغير المصنّفة. كما أثبتت دراساتُ العديد من الخبراء في عدّة جامعات نجاحَ التعلّم العميق في تطبيقاتٍ متنوّعة كالرؤيةِ الحاسوبية والتعرّفِ اللفظي والبحث الصوتي والتعرّفِ إلى الخطاب وترميزِ الصفات الصوري والخطابي والتصنيف الدلالي للكلام وفهمِ اللغات الطبيعية والتعرّف إلى خط اليد ومعالجة الصوت واستعادة المعلومات والروبوتيات وتحليلِ الجزيئات التي قد تؤدي إلى اكتشاف عقاقير جديدة.

تاريخ التعلّم العميق:

كانت معظمُ تقنيات تعلّم الآلة ومعالجة الإشارة حتى وقتٍ قريب تعتمد على معمارياتٍ ذات بنى سطحيّة ضئيلة، حيث احتوت هذه المعماريات على مستوين من تحويلات الخصائص غير الخطية على الأكثر. ومن الأمثلة على هذه المعماريات السطحية:

1- الأنظمة الديناميكية الخطية وغير الخطية.

2- (Gaussian mixture models (GMMs.

3- (Conditional Random Fields (CRFs.

4- (Maximum Entropy (MaxEnt.

5- (Support Vector Machine (SVMs.

6- Logistic Regression.

7- Kernel Regression.

وغيرها.

وقد كانت هذه المعمارياتُ السطحية فعّالةً في حل المشكلات البسيطة أو المبنية بشكلٍ جيد، ولكن محدودية نمذجتها وقدرتها التمثيلية تسبب صعوباتٍ في مواجهة التطبيقات الحقيقية الأكثر تعقيداً كالتطبيقات الحاوية على إشارات طبيعية كخطاب الإنسان والصوت واللغة الطبيعيينو والصور الطبيعية والمشاهد البصرية.

ولكن ميكانيكية معالجة المعلومات ذات المصدر البشري تتطلّب معمارياتٍ عميقةً لاستخراج البنى المعقدة وبناء التمثيلات الداخلية بالاستفادة من الدخل المعطى. فعلى سبيل المثال، أنظمةُ إنتاج الكلام والأنظمةُ المستقبلة له مجهّزةٌ ببنى هرمية طبقية من أجل تحويل المعلومات من طبقة الشكل الموجي إلى الطبقة اللغوية. وكذلك يكون النظام البصري البشري هرمياً بشكلٍ طبيعي ليس فقط في القسم المتخصص بالاستقبال، بل كذلك في الجزء المولّد للمعلومات.

ظهر التعلّم العميق من المجال البحثي الخاص بشبكات الذكاء الصنعي العصبونية، وتعدُّ الشبكات العصبونية ذات التغذية المسبقة MLPs والمجهّزة بعدّة طبقات مخفيّة (وتدعى الشبكات العصبونية العميقة DNNs) مثالاً جيداً عن نماذج البنى العميقة. وقد كان الانتشار الخلفي Back-propagation (BP) والذي أصبح منتشراً في الثمانينيات، خوارزميةً معروفة لتعلّم معاملات هذه الشبكات. ولكن الانتشار الخلفي لوحده لم يعمل بشكلٍ جيدٍ مع شبكات التعلّم التي تملك عدداً كبيراً من الطبقات المخفيّة، وقد كانت الصعوبة تزداد كلّما ازداد عمق هذه الشبكات.

الصورةُ الأولى مثالٌ على الشبكات العصبونية العميقة التي تحوي أكثر من طبقتين مخفيتين، أما الصورة الثانية فهي توضّح كيف تقوم هذه الشبكات العصبونية العميقة بتعلّم التمثيلات الهرمية للسمات.

وبعد الكثير من الأبحاث والتجارب، أخذ استخدامُ الطبقات المخفية ضمن العديد من العصبونات ضمن الشبكة العصبونية العميقة يحسّنُ من قوة نمذجة هذه الشبكات وبدأ يشكّل العديد من التشكيلات المثالية، فحتى وإن تعطّل مسار متحولٍ ما، ستستمرُّ الشبكة العصبونية العميقة الناتجة بأداء عملها بشكلٍ جيد.

ولكن استعمال الشبكات العميقة والواسعة يتطلب طاقةً حسابيةً كبيرة خلال عملية التدريب، وهذا سبب امتناع الباحثين عن العمل مع هذه الشبكات حتى فترةٍ قريبة. كما ساهمت خوارزمياتُ تعليم أفضل في نجاح الشبكات العصبونية العميقة، وكانت خوارزميات (SGD - stochastic gradient descent) هي الأكثر فعّالية مع مجموعات التدريب الكبيرة وهذه هي حالة معظم التطبيقات، كما أثبتت فعاليتها حديثاً في العمل التفرعي عبر عدة آلات في الوضع غير المتزامن، أو عبر عدة وحدات معالجة رسومية من خلال BP.

صفوف شبكات التعلّم العميق:

كما ذكرنا سابقاً فإن التعلّمَ العميق يتعامل مع عدة طبقات من معالجة المعلومات غير الخطية والموجودة هرمياً بشكلٍ طبيعي. وبالاعتماد على طريقة استخدام البنى والتقنيات (تشكيل أو تعرّف أو تصنيف)، فمن الممكن تصنيف العمل في هذا المجال ضمن ثلاثة صفوف:

1- الشبكات العميقة للتعلم المُولد أو بدون إشراف.

تُستخدم عند عدم توافر معلومات عن عدد صفوف الهدف أو تسمياتها حيث تقوم هذه الشبكات بالتقاط الترابط العالي المستوى لمعطيات الدخل محاولة تحليله والكشف عن أنماط في هذه المعطيات

2- الشبكات العميقة للتعلّم المراقب:

وهي ممتازة في تصنيف الأنماط، وذلك عبر توصيف الصفوف الهدف بدقة وفقاً للمعطيات المرئية. وتكون البيانات الهدف المعرّفة متوفّرة دائماً سواء بشكل مباشر أو غير مباشر. وتدعى الشبكات في هذه الحالة بالشبكات العميقة التمييزية.

3- الشبكات العميقة الهجينة:

ويكون هدفها تمييزي ويطبّق على ناتج الشبكات العميقة المولّدة أو غير المراقبة. وتكون الشبكات في هذا النوع أكثر جودةً من شبكات النوع السابق.

مثال على تطبيقات التعلّم العميق:

النمذجة الصوتية من أجل التعرّف إلى الخطاب:

إن التعرف على الخطاب هو من أوائل التطبيقات الناجحة للتعلّم العميق في المجال الصناعي. وتعتمد على نموذج GMM-HMM وهو نموذج خليط غاوس مع أداة HMM التي تطوّر التصنيف الساكن (static classifying) ليدعمَ الأنماط الديناميكية والتسلسلية. وقد بدأت تأثيراتُ التعلّم العميق والشبكات العصبونية العميقة على التعرّف إلى الخطاب في عام 2010 بعد تعاون الباحثين الأكاديميين والصناعيين، حيث بدأ هذا التعاون بمهمّات تعتمد على الهاتف ثم تابع إلى مهمّات تعرّف على المفردات ممّا حقق نجاحاً كبيراً عن طريق استعمال شبكات عصبونية عميقة كبيرة جداً ومماثلة لبنية الوحدات الصوتية في نموذج GMM-HMM.

ولم يكن التعرّف إلى الخطاب هو المجال الوحيد لتطبيق التعلّم العميق، فقد كان له الكثير من الاستعمالات في مجالات النمذجة اللغوية ومعالجةِ اللغات الطبيعية ونُظمِ استرجاع المعلومات والتعرّفِ إلى الأغراض والرؤية الحاسوبية والنمذجة المتعددة ونمذجة تعدّد المهمات.

ويسعى باحثو التعلّم العميق – عملاً بنصيحة خبراء الشبكات العصبونية – إلى تطبيق بنى تعليمية أوسع وأحدث قد تساعد في المجال البيولوجي ونمذجة الدماغ، مما قد يكون له تأثير كبير في الكثير من التطبيقات العملية، وأيضاً في تحقيق فائدةٍ متبادلة قد تخدم خوارزميات التعلّم العميق – بالاستفادة من نماذج الدماغ وبنيتها الهرمية - لجعلها أكثر قوة.

يمكنك من هنا قراءة مقالاتنا في قسم الذكاء الصنعي: هنا

المصدر:

هنا