الهندسة والآليات > التكنولوجيا
قراءة الأفكار: الذكاء الصنعي يحوِّل نشاط الدماغ إلى كلام
تمكنت ثلاثة فرق بحثية من إحراز تقدم ملحوظ في مجال تحويل الإشارات الصادرة عن أدمغة المصابين بالشلل وغير القادرين على النطق إلى كلام؛ إذ تتلقى الأقطابُ الكهربائيةُ المزروعة في الدماغ الإشاراتِ وتعالجها وتفك شفراتها عن طريق الذكاء الصنعي باستخدام نماذج حسابية عن طريق ما يُسمَّى الشبكات العصبونية الاصطناعية، أما الناتج فَيتمثَّل بكلام يُولِّده الحاسوب. ولم تنجح أيًّا من المحاولات السابقة في خلق خطاب كان الشخص يتخيله فقط بل عمل الباحثون على مراقبة أدمغة الناس وهم يقرأون بصوت عالٍ أو يُحركون شفاههم بصمت أو يستمعون للتسجيلات ثم أُعطيت البيانات كافة إلى شبكة عصبية صناعية لكي تتعلم بعض الأشياء الجديدة لِتفسير إشارات الدماغ وبعدها تم أُعيد بناء الأصوات النهائية لكي يتعرف إليها المستمعون. إنَّ فكرة ربط العقول البشرية بالحاسوب ليست جديدة تمامًا، ومن الأحداث المهمة في هذا الصعيد: تمكين الأفراد المشلولين من تشغيل أجهزة الحاسوب بموجات دماغهم وتمكين الأشخاص الذين فقدوا القدرة على الكلام بعد السكتة أو المرض من استخدام أعينهم أو إجراء حركات صغيرة أخرى للتحكم في مؤشر أو اختيار الحروف التي تظهر على الشاشة مثل عالم الكونيات ستيفن هوكينغ الذي كان يُحفِّز المفتاح الموجود على نظارته بحركة خده. وقد يصبح بمقدور هؤلاء الأشخاص استعادة السيطرة على نغمة الصوت أو القدرة على إجراء المحادثات مباشرةً إذا ما نجح التفاعل بين الدماغ والحاسوب. ولكن يجب تدريب نماذج الكمبيوتر على كل فرد، ولتحقيق نماذج أفضل نحتاج بيانات دقيقة للغاية، الأمر الذي يتطلب فتح الجمجمة. ويمكن للباحثين تحقيق مثل هذا الإجراء الغزوي (الجراحي) في حالات نادرة فقط، إحداها في أثناء إزالة ورم دماغي أو عندما تُزرع أقطاب كهربائية للشخص المصاب بالصرع لعدة أيام لتحديد أصل النوبات قبل العلاج الجراحي.
إعادة بناء التحفيز السمعي Auditory stimulus reconstruction: هي تقنية تخلق أفضل تقريب للحافز الصوتي من مجموعة النشاط العصبي المُستحث. ويُمكن لعملية إعادة بناء الخطاب من القشرة السمعية الدماغية البشرية إجراء تحليل عصبي للكلام لإقامة إتصال مباشر مع الدماغ، وقد ثبت أنَّه ممكن في كلا الحالتين: الظاهرية والباطنية. ومع ذلك فإنَّ الجودة المنخفضة للخطاب المعاد بناؤه قد حدت بشدة من فائدة هذه الطريقة لتطبيقات تفاعل الكمبيوتر والدماغ (Brain-Computer Interface BCI)، ومن أجل تطوير أحدث التقنيات جمع الباحثون بين تقنيات التعلم العميق مع أحدث الابتكارات في تقنيات تركيب الكلام لإعادة بناء الخطاب الواضح والمفهوم من القشرة الدماغية السمعية البشرية.
اعتمد فريق Mesgarani على بيانات من خمسة أشخاص يعانون الصرع؛ إذ حلَّلت شبكتهم العصبية تسجيلات من القشرة السمعية (التي تنشط خلال كل من الكلام والاستماع). إذ كان هؤلاء المرضى يستمعون إلى تسجيلات القصص وإلى أشخاص ينطقون الأرقام من صفر إلى تسعة. ثم أعاد الحاسوب بناء الأعداد المنطوقة من البيانات العصبية وحدها، وعندما "قال" الكمبيوتر الأرقام قيَّمه مجموعة من المستمعين بدقة 75٪.
تسجيل (1) : تسجيل إعادة بناء الكلمات من الحاسوب على أساس نشاط الدماغ في حين كان الشخص يستمع إلى الأرقام المنطوقة.
H. AKBARI ET AL.، DOI.ORG/10.1101/350124
اعتمد فريق آخر بقيادة عالمة الكمبيوتر تانيا شولتز في جامعة بريمن في ألمانيا على بيانات من ستة أشخاص يخضعون لجراحة ورم في المخ. وسُجلت أصواتهم في أثناء قراءة الكلمات ذات المقطع الواحد في الوقت نفسه سجلت الأقطاب الكهربائية الإشارات من مناطق الكلام في الدماغ، والمناطق الحركية التي ترسل الأوامر إلى القناة الصوتية لتوضيح الكلمات. ثم طوَّر علماءُ الكمبيوتر ميغيل أنغريك وكريستيان هرف مع علماء جامعة ماسترخت الهولندية Maastricht University شبكةً أخذت قراءات الأقطاب الكهربائية للتسجيلات الصوتية ثم أعادت بناء الكلمات من بيانات الدماغ غير الظاهرة مسبقاً، ووفقاً لنظام تسجيل مُحوسب كانت قرابة 40٪ من الكلمات التي أُنشئت عن طريق الحاسوب مفهومة.
تسجيل (2) : صوت أصلي من أحد المشاركين في الدراسة يتبعه إعادة الحاسوب لكل كلمة بناءً على نشاط تخطيط الدماغ لمناطق الكلام والمناطق الحركية.
M. ANGRICK ET AL.، DOI.ORG/10.1101/478644
وقد أعاد أيضاً جراح الأعصاب إدوارد تشانغ وفريقه من جامعة كاليفورنيا-سان فرانسيسكو بناء جمل كاملة عن طريق نشاط الدماغ المأخوذ من مناطق الكلام والحركة عندما قرأ ثلاثة مرضى مصابين بالصرع بصوت عالٍ. وفي اختبار على الإنترنت، سمع 166 شخصاً الجمل واختاروا الجملة المسموعة من بين عشرة خيارات؛ إذ كانت أكثر من 80% من الأجوبة صحيحة.
ومع ذلك تقول ستيفاني ريس عالمة الأعصاب في جامعة سان دييغو بولاية كاليفورنيا: "ما ننتظره حقاً هو كيف ستعمل هذه الطرائق عندما لا يستطيع المرضى التحدث"إنَّ الإشارات الدماغية لا تتطابق تمامًا مع إشارات الكلام أو السمع عندما يحرك الشخص شفتيه بصمت أو "يسمع" صوته في رأسه، ودون أن يتطابق الصوت الخارجي مع نشاط الدماغ قد يكون من الصعب على الحاسوب حتى أن يقرر أين يبدأ الكلام الداخلي وأين ينتهي.
يقول جيروين شالك وهو خبير في الهندسة العصبية بالمركز الوطني للتكنولوجيا العصبية التكيفية في وزارة الصحة بولاية نيويورك:" إنَّ فك شفرة الكلام الداخلي يتطلب قفزة هائلة، ومن غير الواضح على الإطلاق كيفية فعل ذلك حالياً".
ويقول هرف إنَّ إحدى المقاربات قد تتمثل في تقديم الملاحظات لِمستخدم تفاعل الحاسوب والدماغ: "إذا ما تمكن المستخدم من سماع تفسير الكلام من الحاسوب، فقد يكون بمقدوره تعديل أفكاره للحصول على النتيجة التي يريدها. مع التدريب الكافي لكل من المستخدمين والشبكات العصبية قد يتوصل الدماغ والحاسوب إلى حل وسط.
المصادر:
1- هنا
2- هنا
3- هنا