أنموذج الذكاء الصُّنعي اللُّغوي المتعدد الاستخدامات: GPT-3

استُخدِم الذكاء الصُّنعي (Artificial Intelligence) في أغلب المجالات المُساعِدة للبشرية، ولعلَّ أهمها مجال معالجة اللغات الطبيعية (NLP: Natural Language Processing)؛ إذ أُنشِئَت العديد من نماذج اللُّغة المتفاوتة في مستويات تطورها والمختلفة في مجال استخدامها.
وقد طوّرت شركة الأبحاث Open AI أنموذجًا جديدًا قابلًا للاستخدام في أكثر من عملية لغوية، على سبيل المثال: تصحيح القواعد أو إنشاء كود برمجي عندما يُطلَب منه ذلك، فهو لا يقتصر على وظيفة محددة دون سواها.

لمحة عامة عن GPT-3
في يونيو عام 2020؛ طوَّرت شركة الأبحاث OpenAI في سان فرانسيسكو كاليفورنيا أنموذجَ ذكاء صنعي يولّد تدفقاتٍ نصية بطلاقة، وذلك بعد التدرب على مليارات الكلمات من الكتب والمقالات إضافةً إلى المواقع الإلكترونية؛ إنه (GPT-3: (Generative Pretrained Transformer 3 الثالث من سلالة GPT، وهو أكبر بأكثر من 100 مرة من GPT-2، كذلك يُعدّ أقوى وأكثرَ تماسكًا من أيّ نظام ذكاء صنعي سابق للتعامل مع اللغة، فقد دُرِّب على قرابة 200 مليار كلمة بتكلفة تُقدّر بعشرات الملايين من الدولارات (1).

نماذج اللغة (Language Models)
تُدرَّب الشبكات العصبونية (Neural Networks) المكوّنة لنماذج اللغة عن طريق التنبؤ بالكلمات المظلمة (Blanked-Out Words) في النصوص التي تراها، ومن ثمَّ تضبط قوة الروابط بين العصبونات (Neurons) للشبكات المتعددة الطبقات بهدف تقليل الخطأ في التنبؤ.

يُقاس حجم الشبكة العصبونية وبالتالي قوتها قياسًا تقريبيًّا عن طريق عدد البارامترات (Parameters) التي تمتلكها، والتي تحدّد بدورها قوةَ الروابط بين العصبونات. إنّ المزيد من العصبونات والمزيد من الموصلات يؤدي إلى المزيد من البارامترات.

تحتوي GPT-3 على 175 مليار بارامتر، إضافةً إلى أنها تتفوق في البرمجة الموجهة (Prompt Programming)؛ أي تكييف استجابتها لنمط نص الإدخال ومحتواه (1).

المحوّلات (Transformers)
في عام 2017؛ ابتكر الباحثون تقنية رياضية موفرة للوقت أسموها المحوّل (Transformer)، وفي العام التالي أصدرت غوغل أنموذجًا كبيرًا قائمًا على هذه التقنية يُدعَى BERT (Bidirectional Encoder Representations from ،(Transformers، إضافةً إلى العديد من النماذج الأخرى المعتمدة على آلية عمل المحولات.

تتمحور الفكرة الرئيسة للمحوّلات حول الاستعاضة عن الطبقات التكرارية الشائعة في أغلب بنى المرمّز/ مفكك الترميز (Encoder-Decoder Architectures) بالانتباه الذاتي المتعدد الرؤوس (Multi-Headed Self-Attention).

فالانتباه (Attention) عمومًا عبارة عن تابع يربط مجموعة من المتجهات (Vectors) بعضها ببعض؛ وهي متجهات الاستعلام (Query)، ومتجهات المفاتيح (Key)، ومتجهات القيم (Value)، ومتجهات الخرج (Output). ويُحسَب الخرج باستخدام الجمع الموزون لمتّجهات القيم؛ إذ يستخدم تابع توافق (Compatibility Function) بين الاستعلام والمفتاح المقابل له لحساب الوزن المخصص لكل قيمة. وتُطبَّق الاستعلامات والمفاتيح والقيم خطيًّا h مرة، وذلك للحصول على الانتباه المتعدد الرؤوس (Multi-Head Attention).
أما الانتباه الذاتي (Self-Attention) فهو آلية انتباه تربط مواقع مختلفة في التسلسل بهدف الوصول لتمثيل هذا التسلسل (1,2).

إيجابيات GPT-3 وسلبياته

يستطيع GPT-3 أداء العديد من المَهمّات ومنها:
كتابة قصص إخبارية لا يمكن تمييزها عن النثر الذي يكتبه البشر.
حل الأسئلة التافهة (Trivia Questions).
تصحيح القواعد.
حل المشكلات الرياضية.
إنشاء كود برمجي عندما يُطلَب منه أداء مهمة برمجية.

يمكن أن تنجز أنظمة الذكاء الصُّنعي الأخرى هذه الأشياء، ولكن فقط بعد أن تُدرَّب تدريبًا خاصًّا لكل وظيفة.
من ناحية أخرى؛ لا يزال لدى GPT-3 نقاط ضعف خطيرة وأحيانًا يرتكب أخطاءً سخيفة للغاية، لأنه يعمل عن طريق مراقبة العلاقات الإحصائية بين الكلمات والعبارات التي يقرأها دون فهم معناها.
وهو أحيانًا يُعطي إجابات غير منطقية أو ردود خطيرة، على سبيل المثال: سألت شركةُ رعايةٍ صحية تُدعَى نابلا (Nabla): "هل يجب أن أقتل نفسي؟"، فأجاب روبوت محادثة يعتمد على تقنية GPT-3 عن السؤال كما يأتي: "أعتقد أنه ينبغي لك ذلك".

فحصَ باحثو OpenAI تحيّزاتِ GPT-3 أيضًا في بحثهم في 1 مايو عام 2020؛ إذ طلبوا منه إكمالَ جُمَل مثل "كان الرجل الأسود شديد الجمال"، فوصف السود بعبارات سلبية مقارنة بالأشخاص البيض، كذلك ربط الإسلام بكلمة العنف، وافترض أنّ الممرضات وموظفي الاستقبال نساء. إنّ هذا النوع من المشكلات يمثّل مصدرَ قلق كبير تجاه نماذج اللغة الكبيرة.
مهما كانت إخفاقات GPT-3 فقد تعلمتها من البشر؛ فمجموعةُ بيانات التدريب الضخمة الخاصة به لم تتضمّن المواقع العلمية فقط، بل مواقع المناقشات -على سبيل المثال Reddit- التي قد تحمل في طيّاتها ألفاظًا غير محبّذة.
من ناحية أخرى؛ يتعلم الأطفال بالرؤية والتجربة والتصرف، ولذلك يعتقد بعض الباحثين أنّ النماذج اللغوية قد لا تحقق الحسَّ السليم الموجود لدى الإنسان أبدًا، طالما أنها تبقى في مجال اللغة فقط. فالناس لا يستوعبون رواية ما من خلال تشغيل الإحصائيات على الكلمات ومدى تكرارها في النص (1,3).

حلول ممكنة للتغلب على المشكلات السابقة
تتمثل إحدى الطرائق الواضحة لحل هذا التحيُّز بالتخلص من النص الخطير (toxic text) الموجود في بيانات ما قبل التدريب، ولكنّ هذا يثير العديد من الأسئلة عمّا يجب استبعاده.

جزئيًّا؛ تحمي OpenAI من الاستخدام الضار لـ GPT-3 عن طريق تقديم واجهة برمجة التطبيقات (API) للمستخدمين فقط بدلًا من الكود نفسه. كذلك يفحص فريقٌ داخلي التطبيقات المقترحة، ويوفّر إرشادات السلامة لتلك الشركات التي منحت حق الوصول إلى GPT-3 عبر واجهة برمجة التطبيقات (API)، ومراجعة التطبيقات مرة أخرى قبل النشر، إضافةً إلى مراقبة استخدامها بعد النشر. كذلك تعمل OpenAI على تطوير أدوات لمساعدة المستخدمين على التحكم في نص GPT-3 المنشأ تحكمًا أفضل.

في بعض الحالات رُفِضَت التطبيقات لأنّ منتجاتها المقترحة كانت شديد الحساسية. وفي حالات أخرى كان وجودُ إنسانٍ يراجع النص الذي أنشَأه الذكاء الصنعي أمرٌ لا مفرّ منه قبل أن يصل إلى العميل أو المستخدم (1,3).

وأخيرًا، على الرغم مما يعانيه GPT-3 من مشكلات؛ فلا يمكن إهمال أهميته في مسار تطوير النماذج اللغوية بهدف الحصول على أدوات مساعدة للذكاء البشري قادرة على إنتاجِ نصوصٍ سليمة وآمنة إنتاجًا آليًّا.

المصادر:

1. Hutson M. Robo-writers: the rise and risks of language-generating AI. Nature [Internet]. 2021 [cited 10 December 2021];591(7848):22-25. Available from: هنا
2. Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, Gomez A et al. Attention Is All You Need. [Internet]. Advances in Neural Information Processing Systems 30 (NIPS 2017).USA; 2017.[cited 9 July 2021]. p. 1-11. Available from: هنا
3. Strickland E. OpenAI's GPT-3 Speaks! (Kindly Disregard Toxic Language) [Internet]. IEEE Spectrum: Technology, Engineering, and Science News. 2021 [cited 2021]. Available from: هنا

أنموذج الذكاء الصُّنعي اللُّغوي المتعدد الاستخدامات: GPT-3

المعلوماتية >>>> الذكاء الصنعي

المساهمون في الإعداد

استمع لمقال عشوائي

من أعد المقال؟

مواضيع مرتبطة

سحابة المستشعرات الافتراضية - الجزء الثاني

برمجيات تجسس صوتية

عيد ميلاد غوغل الـ 18

ثمان حقائق لا تعرفها عن نظام أندرويد!

كيف تتم عملية الـTagging في الفيس بوك؟

مرحلة الاختيار... محرك القرص الصلب أم محرك الحالة الثابتة أم الاثنين معًا؟!

هل يُمكن للأصوات المُقلدة آلياً أن تخدع الإنسان والآلة!

منشوراتك وتعليقاتك تُحدد جنسك وعمرك!

طابعة معدنية ثلاثية الأبعاد

أنظمة حماية الشبكات اللاسلكية

أنموذج الذكاء الصُّنعي اللُّغوي المتعدد الاستخدامات: GPT-3

المعلوماتية >>>> الذكاء الصنعي

مواضيع مرتبطة إضافية المزيد >

شارك

تفاصيل

المساهمون في الإعداد

استمع لمقال عشوائي

من أعد المقال؟

مواضيع مرتبطة

سحابة المستشعرات الافتراضية - الجزء الثاني

برمجيات تجسس صوتية

عيد ميلاد غوغل الـ 18

ثمان حقائق لا تعرفها عن نظام أندرويد!

كيف تتم عملية الـTagging في الفيس بوك؟

مرحلة الاختيار... محرك القرص الصلب أم محرك الحالة الثابتة أم الاثنين معًا؟!

هل يُمكن للأصوات المُقلدة آلياً أن تخدع الإنسان والآلة!

منشوراتك وتعليقاتك تُحدد جنسك وعمرك!

طابعة معدنية ثلاثية الأبعاد

أنظمة حماية الشبكات اللاسلكية

مواضيع مرتبطة إضافية
المزيد >