إعادة صور الأسود والأبيض للحياة باستخدام الذكاء الصنعي
المعلوماتية >>>> الذكاء الصنعي
اقتصرت عملية تلوين الصور على الأشخاص ذوي الموهبة الإبداعية في الماضي، وقد كانت تُنفَّذ يدويًّا وتتطلب كثيرًا من الوقت والجهد؛ مما يجعلها عملية مكلفة، لكنّها تعطي نتائج واقعية ودقيقة. - أداة Algorithmia-Colorful Image Colorization: تعتمد هذه الأداة على استخدام شبكة عصبونية (Neural Network) من نوع الشبكة العصبونية التلافيفية (Convolutional Neural Network) أو (CNN) اختصارًا، وهي قادرة على تلوين صور الأبيض والأسود بنتائج يمكن أن تخدع البشر (2)! مصدر الصورة : (1) يمكنك تجربة هذه الأداة واستعمالها عن طريق الرابط أدناه: مثال على تلوين الصور باستخدام الطريقة السابقة: مصدر الصورة : (3) مثال على تلوين الصور باستخدام أداة (3) Colourise.sg: مصدر الصورة : (3) إذًا، ما الفرق بين الأداتين السابقتين؟
على أية حال؛ بفضل التطور التقني الحالي يستطيع أيُّ شخص ذي معرفة تقنية بسيطة أن يرفع صوره القديمة لتلوينها باستعمال تقنيات الذكاء الصنعي والتعلم العميق، وذلك عن طريق عدة أدوات.
تلوين الصورة: هي عملية التقاط صورة تدرج الرمادي (أبيض وأسود)، ثم إنتاج صورة ملونة تتمثل بالألوان وحرارة اللون، وعلى سبيل المثال؛ يجب أن يكون المحيط في يوم مشمس واضحًا (اللون الأزرق البارد)، ولا يمكن تلوينه باللون الوردي الحار (1).
ويتمثل الهدف من تلوين الصور في الإجابة عن عدة أسئلة، منها: هل كان هناك شيء حول ترتيب الألوان أجبر المصور على التقاط هذه اللحظة بالذات؟ وإذا كان الأمر كذلك، فهل رأى المصور شيئًا لا نمتلكه -نحن مشاهدو العصر الحديث لهذه الصورة بالأبيض والأسود- (3)؟
وقد كانت الطرائق الإلكترونية السابقة لتلوين الصورة تعتمد على التفاعل والتدخل البشري في مراحل معينة، وكانت تعطي نتائج ذات تلوين غير مُشبع (1).
أما النهج الجديد الذي سنتكلم عنه اليوم، فيعتمد -بدلًا من ذلك- على التعلم العميق (Deep Learning)، وسنتكلم عن أهم أداتين تُنجِزان عملية التلوين هذه:
تعتمد الأداة في عملها على أنموذج مقترح في ورقة بحثية بعنوان "Colorful Image Colorization" للباحثين في جامعة كاليفورنيا (University of California، Berkeley)، ويمكن تلخيص العملية (المبسّطة) المذكورة في الورقة بأكملها على النحو الآتي (2):
تتضمن الطريقة تدريب شبكة عصبونية تلافيفية (CNN) على مجموعة كبيرة من الصور الملونة التي حُوِّلَت إلى فضاء ألوان Lab. وفي فضاء الألوان هذا، تتكون الصورة من 3 قنوات؛ الإضاءة L، وa(أحمر-أخضر)، وb (أزرق-أصفر)، ويُستخدَم فضاء الألوان هذا لأنه متوافق على نحو أفضل من RGB مع طبيعة الإبصار البشري للإضاءة (2).
بدايةً تُدرَّب الشبكة -التي ستنجز لاحقًا عملية التلوين- باستخدام أكثر من مليون صورة ملونة؛ إذ تُعطَى قناة الإضاءة L وقنوات الألوان a وb بوصفهم مدخلًا للأنموذج في أثناء التدريب (2).
صورة مخطط مُبسَّط لمرحلة تدريب الأنموذج (1)
Image: syr-res
مصدر الصورة : (1)
لاحقًا بعد تدريب الأنموذج؛ يمكن إدخال صورة بالأسود والأبيض، فيتنبَّأ الأنموذج بألوان الصورة -تحديدًا القناة a وb من الفضاء اللوني Lab-، ومن ثم يدمجها للحصول على الصورة النهائية الملونة، ويمكن تحويلها مرة أخرى إلى RGB، كذلك يمكن استعمال الطريقة نفسها لتلوين الفيديو (1).
مخطط مُبسَّط لعملية التلوين باستخدام الأنموذج (1)
Image: syr-res
- أداة Colourise.sg:
هي أداة من تطوير فريق في قسم الذكاء الصنعي وعلوم البيانات في مركز "GovTech" في سنغافورة.
تُلوّن الأداة -على نحو أساسي- الصورَ بالاعتماد على الذكاء الصنعي والتعلم العميق، ودُرِّبت باستخدام الصور السنغافورية القديمة (3).
لمعرفة كيف تعمل هذه الأداة؛ لا بُدّ من فهم عملية التلوين التقليدية، لأن إنشاء صورة ملونة تقليديًّا يتطلّب من الفنان المختص في التلوين ذي الخبرة إنجاز المهمتين الآتيتين (3):
1- إجراء بحث عن السياق التاريخي والجغرافي والثقافي للصورة من أجل استخلاص الألوان المناسبة.
2- تلوين الصورة باستخدام أدوات برمجية مثل Adobe Photoshop.
وبالمثل، يحتاج برنامج الحاسوب إلى أداء المهمتين السابقتين، وإن كان ذلك بطريقة مختلفة قليلًا؛ إذ يحتاج البرنامج إلى (3):
1- تحديد الأشياء في صورة الأبيض والأسود.
2- معرفة اللون المعقول للكائنات أو الأشياء التي التُقِطت في الصورة التي شاهدتها في الماضي.
3- تلوين صورة الأبيض والأسود.
تعتمد الأداة لتلوين الصور على تقنية في التعلم العميق تُعرف باسم الشبكة التنافسية التوليديَّة (Generative Adversarial Network) أو (GAN) اختصارًا، ويشمل هذا طبقتين من الشبكات العصبونية (4):
- الشبكة الأولى (المولّدة generator): تحاول التنبؤ بقيم الألوان في وحدات البكسل المختلفة في الصورة، بناءً على الميزات الموجودة في الصورة.
- الشبكة الثانية (المُميّزة discriminator): تحاول تحديد ما إذا كانت الألوان التي أُنشِئت واقعيةً في الصورة مقارنة بالصورة الملونة الأصلية.
يُدرَّب الأنموذج حتى تتمكن "الشبكة المولدة" من توقع الألوان التي لا يمكن "للشبكة المميزة" تمييزها -على نحو فعال- على أنها مزيفة.
نعرض فيما يأتي عرضًا مبسّطًا للهندسة المعمارية المستخدمة في التدريب (3):
بنية مبسطة لعملية التلوين باستخدام تقنية "GANs"
Image: syr-res
يمكنك تجربة هذه الأداة واستعمالها عن طريق الرابط أدناه: هنا
في الحقيقة؛ أغلبُ الفروق هي في الإضافات على الخوارزميات المستخدمة التي قد تعطي نتائج أكثر دقة. وبطبيعة الحال؛ إن اختلاف مجموعة البيانات (dataset) التي دُرِّبت كلتا الخوارزميات عليها يعطي فرقًا جوهريًّا في النتائج (3).
في النهاية، من المستحيل استعادة الظروف المماثلة التي التُقِطت فيها الصورة الأصلية، ولكن؛ من الممكن أن تساعدنا إضافةُ اللون على فهم ماذا رأى المصور في تلك اللحظة وتخيّله، وقد يوصلنا تطور التقنية في هذا المجال إلى فهمٍ أكبر لماضينا عن طريق إعادة إحياء الصور القديمة أو مقاطع الفيديو القديمة.
المصادر:
2- Zhang R، Isola P، Efros A. Colorful Image Colorization [Internet]. arXiv.org. 2016 [cited 30 May 2020]. Available from: هنا
3- Lim P. ColouriseSG [Internet]. Colourise.sg. 2019 [cited 30 May 2020]. Available from: هنا
4- Lim P. Bringing black and white photos to life using Colourise.sg [Internet]. Medium. 2019 [cited 30 May 2020]. Available from: هنا