المعلوماتية > الذكاء الصنعي

️ إنتاج منحوتات متحركة بالطباعة الثلاثية الأبعاد من مقاطع فيديو ثنائية البعد

هل سبق وأن علمت الطريقة الصحيحة لتحسين تأديتك أفعالًا كنشاط رياضي؟ 

توصل باحثو معهد ماساشوستس للتقنية MIT إلى طريقة سهلة لذلك؛ عن طريق نظام جديد يستخدم خوارزمية من شأنها تحويل مقطع فيديو ثنائي البعد إلى منحوتات متحركة ثلاثية الأبعاد (3D Motion Sculptures) تظهر كيفية تحرك جسم الإنسان في حيز المكان؛ مما يسهل متابعة تسلسل الحركات التي أديتها.

ينسب توم برادي (وهو الظهير الربعي في كرة القدم الأمريكية في فريق باتريوت Patriots) نجاحه إلى قضاء ساعات طوال في دراسة حركات خصمه في فيديو مسجل للمباريات. 

إن هذا الاستيعاب للحركات هو أمر ضروري لجميع الكائنات الحية، سواء كان الأمر لاكتشاف أي زاوية هي الأنسب لرمي الكرة إليها، أو توقع حركة الحيوانات المفترسة أو الفرائس. لكن مقاطع الفيديو البسيطة لا يمكن أن تظهر المشهد على نحو كامل. وهذا لأن الصور ومقاطع الفيديو التقليدية تتيح دراسة الحركة ضمن المشهد المصور في فضاء ثنائي البعد فقط، ولا تظهر البنية الضمنية للبعد الثالث للأشخاص أو الأغراض ضمن المشهد. 

لا يمكن فحص الحركات الصغيرة والخفيفة التي تساعدنا على التحرك على نحو أسرع دون وجود الشكل الهندسي كاملًا أو استيعاب الدقة اللازمة للوصول إلى كمال شكلنا الرياضي.

في الآونة الأخيرة، توصل الباحثون في مختبر علوم الحاسوب والذكاء الصنعي CSAIL في معهد MIT إلى طريقة للحصول على معالجة أفضل لفهم الحركات المعقدة.

يستخدم النظام الجديد (MoSculp) خوارزمية بإمكانها أخذ مقطع فيديو ثنائي البعد كدخل، وتحويله إلى منحوتات متحركة ثلاثية الأبعاد تظهر كيفية تحرك جسم الإنسان في حيز المكان.

إضافة إلى كونه تصورًا جماليًّا مثيرًا للاهتمام من ناحية الشكل والوقت، يتصور الفريق أنه من الممكن لنظامهم أن يتيح دراسة أكثر تفصيلًا لحركة الرياضيين المحترفين أو الراقصين أو لأي أحد يرغب في تحسين مهاراته البدنية.

يوضح طالب الدكتوراه شيومينغ زانغ Xiuming Zhang (وهو مؤلف الورقة البحثية) النظام في قوله: "تخيل أن لديك مقطع فيديو لروجر فيديرر Roger Federer وهو يرمي كرة في مباراة كرة تنس، ومقطع فيديو لك وأنت تتعلم التنس، سيكون بإمكانك بناء تماثيل متحركة لكلا السيناريوهين السابقين بغرض مقارنتهما وإجراء دراسة أكثر شمولًا للمهارات التي يجب تحسينها".

ولأن المنحوتات المولَّدة هي ثلاثية الأبعاد، فبإمكان المستخدمين استخدام واجهة الحاسوب للتنقل بين المنحوتات ورؤيتها من منظورات مختلفة؛ مما يكشف عن معلومات متعلقة بالحركة كان يتعذر الحصول عليها من الصورة الأصلية التي تقدم منظورَ رؤيةٍ وحيدًا لها.

كيف يعمل النظام؟

عانى الفنانون والعلماء فترة طويلة للحصول على منظور أفضل للحركة المقيدة بعدسة الكاميرات الخاصة بهم، وبما يمكن أن توفر هذه الكاميرا لهم.

استخدم عمل سابق ما يدعى بتقنيات التصوير الستروبوسكوبي "stroboscopic" في غالب الأحيان، والتي تشبه إلى حد كبير عرض الصور المُجمَّعة في كتاب عن طريق تقليب صفحاته المتتالية بسرعة. ولكن نظرًا إلى أن هذه الصور تظهر لقطات للحركة فقط، لن نتمكن- على سبيل المثال- من رؤية مسار ذراع اللاعب حين يرمي كرة الغولف.

أضف إلى ذلك، أن هذه الصور تتطلب إعدادًا شاقًّا قبل التصوير أيضًا، مثل: استخدام خلفية نظيفة وكاميرات عمق متخصصة ومعدات إضاءة، في حين أن احتياجات نظام MoSculp هي مجرد مقطع فيديو بسيط.

عند إدخال مقطع فيديو إلى النظام؛ فإنه يحدد أولًا النقاط الرئيسة الثنائية البعد على جسم الشخصية المُتحركة داخل الفيديو، مثل الورك والركبة والكاحل لراقصة باليه- مثلًا- في أثناء إنجازها رقصة معقدة. بعد ذلك تؤخذ أفضل الوضعيات المتاحة من هذه النقاط لتحويلها إلى منحوتة ثلاثية الأبعاد.

بعد تجميع هذه المنحوتات معًا، يولد النظام تمثالًا للحركة يمكن طباعته بشكل ثلاثي الأبعاد، يظهر النظام المسارَ الذي تتبعه الشخصية على نحو سلس ومستمر. 

ويمكن للمستخدم تخصيص الأشكال الخاصة به والتركيز على أقسام متعددة من الجسد، واستخدام معدات مختلفة للتمييز بين هذه الأجزاء، ويمكنه التحكم بالإضاءة أيضًا.

فيديو توضيحي يبين آلية عمل النظام:

في دراسات أجريت على المستخدم، وجد الباحثون أن أكثر من 75% من الأشخاص شعروا أن نظام MoSculp زودهم بتصوير أكثر تفصيلًا لدراسة الحركة من تقنيات التصوير التقليدية.

تقدم رئيسة الاتصالات في شركة Adobe كورتني بريجهام Courtney Brigham توضيحًا للنظام في قولها: "يبدو الرقص والحركات الرياضية التي تحتاج إلى المهارات العالية مثل منحوتات متحركة، لكنها تخلف فقط أشكالًا سريعة الزوال، ويوضح هذا العمل كيفية أخذ الحركات وتحويلها إلى منحوتات حقيقية مع تصور موضوعي للحركة؛ مما يوفر للرياضيين طريقًا لتحليل حركاتهم من أجل التدريب، كل ذلك لا يتطلب سوى كاميرا هاتف محمول وبعض الوقت لإنجاز عمليات الحوسبة".

يعمل النظام على نحو أفضل من أجل حركات أكثر، مثل رمي كرة أو القيام بقفزة واسعة في أثناء الرقص. ثم إنه يصلح أيضًا في المشاهد التي تُعرقَل فيها الحركة أو يزداد تعقيدها؛ مثل مشهد يتضمن أشخاصًا يرتدون ملابس فضفاضة أو أشخاصًا يحملون أغراضًا.    

في الوقت الحالي، يستخدم النظام سيناريوهات لشخص واحد فقط، لكن فريق العمل يأمل قريبًا في التوسع ليشمل عدة أشخاص. قد يتيح ذلك الفرصة لدراسة مواضيع مثل الاضطرابات الاجتماعية والتفاعلات الشخصية وانسجام فريق العمل.

المصادر:

1- هنا

2- هنا