المعلوماتية > الذكاء الصنعي
رسومٌ متحركة من صنع الخوارزميات
الرسومُ المتحركةُ هي سلسلةٌ من الصور المتتالية تحكي قصة ما، وغالبًا ما تكون هذه الصور مرسومة باليد لما يمتلكه هذا الفنُّ من دقَّة وإحساس يجعل تعلُّمه من قِبَل الآلة صعبًا جدًّا، ومكلفًا للغاية.
ولذلك؛ يُعدُّ وجودُ خوارزميةٍ يمكنها تحويل أية صورةٍ إلى رسومٍ متحركة دون مواجهة صعوباتٍ ثورةً في مجال تعليم الآلة.
الخوارزميات السابقة:
تمكَّن فريق بحثٍ ألماني في بداية عام 2015 من نقل نمطٍ فني بين صورةٍ وأخرى، وتتابعت الأبحاث بعدها؛ إذ تمكَّن العلماء من نقل أسلوب فنانين عظماء مثل "بيكاسو" و"فان جوخ" إلى صورٍ أخرى.
استُخدامت خوارزميات الشبكات العصبونية في هذا المجال على يد "ليون غاتيس" Leon Gatys في جامعة "توبينغن" University of Tubingen، وعددٍ قليل من الزملاء؛ إذ درسوا طريقة الخوارزمية في تسجيل النمط الفني وتحليله، ولمّا كانت الشبكات العصبونية تتكون من طبقاتٍ مختلفة؛ توصلوا إلى جعل كل طبقةٍ تحلِّلُ مستوى مختلف من الصورة كالشكل والألوان والخطوط.
تتمثل الفكرة الرئيسة في عمل "غاتيس" في عدم تصوير النمط الفني في الطبقات بحد ذاتها، بل في الارتباطات فيما بينها، مما أتاح القدرة على فصل أسلوب الفنان عن المحتوى ونقله إلى صورة أخرى؛ فكانت هذه الفكرة أساسًا لمنظومةٍ جديدة عُرفت بنقل النمط العصبي.
واجه "غايتس" -على الرغم من كمالية هذه الفكرة- مشكلةً وحيدة، وهي ضخامة العملية وكثافتها بالنسبة إلى الحواسيب؛ إذ تستغرق العملية وقتًا طويلًا لفصل الطبقات وتحليلها، لذلك بدأ علماء الحاسوب في البحث عن أساليب مختلفة تؤدي المهمة بسرعة أكبر وبالجودة والكفاءة نفسها.
إيجاد الخوارزمية البديلة:
تمكن الباحثان Maciej Pesko "ماتشي بيسكو"، و Tomasz Trzcinski "توماس ترتستشنسكي" في جامعة "وارسو/بولندا" من تحويل الصور إلى رسومٍ متحركةٍ مستخدمين الخوارزميات العصبونية أيضًا، وتقنيات نقل الأسلوب الفني بين صورة وأخرى؛ هادفين إلى توليد صورٍ بأسلوب الفنانين الكبار، وتحويل الصور من صور ليلية إلى نهارية، والقدرة على تبديل الوجوه في الصور.
اختبر "بيسكو" و "ترتستشنسكي" مجموعةً واسعةً من خوارزميات نقل النمط العصبي في مهمةٍ محددة وهي نقل أنماط رسوم ذات طابَعٍ كرتوني.
وللحصول على الخوارزمية الأنجح؛ اختبر الباحثان خمسَ خوارزميات مختلفة على صور بأبعاد 600x450 بيكسل، والتي عولجت باستخدام وحدة معالجة الرسومات "تيتان اكس" TitanX بسعة 12 جيجا بايت.
وعُرضت النتائج على 100 شخص بهدف تقييم أفضل نتيجة، فكانت غالبية الأصوات لصالح تقنية التطبيع التكيفي adaptive instance normalization؛ إذ تعطي هذه التقنية نتائج أقرب إلى الرسوم الكاريكاتورية أو الرسوم الهزلية من حيث تشابه الأسلوب.
وقد كانت هذه الصورة a jumping horse and rider هي الصورة الأولى التي حولها Maciej Pesko باستخدام التقنية الجديدة، ومع ذلك نرى أن النتائج ليست مثالية على الإطلاق؛ فجميع التقنيات تعاني إلى حد ما مشكلاتٍ مثل نقل اللون غير الملائم والضبابية وغيرها.
وختامًا؛ يعتقد الباحثون أنهم سيتمكنون من إيجاد حلٍّ لهذه المشكلات. أهمها تطوير شكل الشخصيات، وإبراز تفاصيل أكثر على الرغم من عدم قدرة الشبكات العصبونية على التغلب على هذه المشكلات حتى الآن.
المصادر: