المعلوماتية > الذكاء الصنعي
الحواسيب التي تلعب الشطرنج؛ ماذا تعرفون عنها؟
تُعدّ لعبة الشطرنج في طليعة الأبحاث في مجال الذكاء الصنعي منذ اقتراح آلان تورينغ Alan Turing* وتلاميذه آلات لعب الشطرنج، وقد اختلفت إستراتيجيات اللعب الخاصة بالذكاء الصنعي واللاعبين البشريين على نحو متناسب مع زيادة قوة الحوسبة المتاحة؛ وهي سرعة المعالجة ومساحة التخزين.
يعتمد اللاعبون البشريون ويهدفون إلى تحقيق أنماط معينة معروفة مسبقًا؛ إذ يجرون بحثًا عميقًا مُرجَّحًا عن التحركات التي تؤدي إلى هذه الأنماط المرغوبة، وينقلون معرفتهم السابقة لتكييفها مع وضعهم الحالي ضمن المباراة.
أما عن لعب الشطرنج باستخدام الذكاء الصنعي، فيكون غالبًا عن طريق التحليل بواسطة قاعدة بيانات ضخمة، مع استخدام خوارزميات بحث واسعة للبحث عن الخطوة المثالية التالية.
تعمل محركات الشطرنج جميعها عن طريق النظر إلى مجموعة فرعية محددة تجريبيًّا من التحركات القانونية الناشئة عن موضع معين، وتقييم الأرقام لتمثيل القيمة النسبية للموضع الجديد الذي حُصِل عليه عن طريق أداء هذه التحركات؛ ثم فعل الشيء نفسه على نحو متكرر للمواقع الناتجة.
يُنجَز ذلك باستخدام توابع التقييم (Evaluation Functions)، وتوفر توابع التقييم الفعالة مجموعةَ أدوات أفضل لتوجيه البحث في شجرة الشطرنج عن الخطوة التالية؛ مما يحسّن قوة محركات البحث الشطرنجية المعتمدة على الذكاء الصنعي وسرعتها (6).
سوف نستعرض في هذا المقال أقوى محركات لعب الشطرنج في العالم حاليًّا، والتي تتنافس فيما بينها لتثبت من الأفضل.
ديب بلو (Deep Blue)
في 11 مايو 1997، فاز حاسوب IBM المدعو "Deep Blue" على بطل الشطرنج العالمي آنذاك غاري كاسباروف Garry Kasparov بعد ست مباريات استمرت عدة أيام وحظيت بتغطية إعلامية عالمية ضخمة، فاز فيها الحاسب مرتين، وفاز Kasparov مباراة وتعادلا بثلاث.
كانت المواجهة الأولى بين الإنسان والآلة، لكنّ وراء هذا الإنجاز يقف علم مهم من علوم الحاسوب، الذي يدفع بقدرة هذه الأجهزة على التعامل مع مختلف أنواع الحسابات المعقدة، وإجراء النمذجة، وتحليل المخاطر، والتعامل مع البيانات الكبيرة، والبحث في قواعد البيانات الكبيرة؛ مما يساهم في تطوير العديد من العلوم، وليس لعب الشطرنج فقط (4).
اهتمّ علماء IBM بحوسبة الشطرنج منذ بداية الخمسينات، وفي عام 1985 بدأ طالب الدراسات العليا فانغ هسو (Feng-hsiung Hsu) أطروحته "آلة لعب الشطرنج ChipTest" مع زميله موراي كامبل Murray Campbel، وانضم كلاهما إلى IBM عام 1989 وواصلا العمل على المشروع الذي أُطلِق عليه اسم Deep Blue.
خسر الحاسب أولى مبارياته أمام بطل الشطرنج البشري عام 1996، لتكون العودة في العام الذي يليه.
جرى اللقاء في نيويورك، وحظي بملايين المشاهدات، ولم تكن احتمالات فوز الحاسب مؤكدة.
علم علماء IBM أنّ حاسبهم قادرٌ على حساب 200 مليون احتمال في الثانية، وما عليهم إلّا الصبر. فاز البطل في المباراة الأولى، أما الثانية فكانت من نصيب الحاسب، وتلاها ثلاثة تعادلات ليكتسح الحاسب المباراة السادسة (4).
كان لحاسب Deep Blue تأثيرٌ في الحوسبة في العديد من الصناعات المختلفة، وهو بُرمِج لحل لعبة الشطرنج الإستراتيجية المعقدة، ولذلك؛ مكّن الباحثين من استكشاف حدود المعالجة المتوازية (Parallel processing) وفهمها على نطاق واسع؛ إذ أعطى هذا البحثُ المطوّرين نظرةً ثاقبة إلى الطرائق التي يمكنهم من خلالها تصميم جهاز حاسب لمعالجة المشكلات المعقدة في المجالات الأخرى، وذلك باستخدام المعرفة العميقة (deep knowledge) لتحليل عدد أكبر من الحلول الممكنة، وقد طُبِّقت البنية المستخدمة في Deep Blue على النمذجة المالية.
استخدم Deep Blue خوارزمية Alpha-Beta، وهي عبارة عن تحسين خوارزمية MiniMax؛ إذ تحسّن من وقت الحاسب عند البحث ضمن عدد كبير جدًّا من الاحتمالات؛ مما يسمح بالذهاب إلى مستويات أعمق ضمن شجرة اللعبة، وتتوقف عملية البحث عند العثور على نتيجة تثبت أنّ الحركة هي أسوأ من سابقتها (4).
في نهاية المطاف، تقاعد Deep Blue في متحف Smithsonian في العاصمة واشنطن، في حين استمرّت أبحاث IBM في هذا المجال ونتج عنها العديد من الأجهزة الخارقة مثل IBM Blue Gene (4).
غاري كاسباروف في مباراته مع Deep Blue
ستوك فيش (Stockfish)
هو محرّك شطرنج مفتوح المصدر متوافق مع واجهة الشطرنج العالمية UCI-Universal Chess Interface (وهو بروتوكول اتصال مفتوح لمحرّكات الشطرنج لتشغيل الألعاب تلقائيًّا)، طوّره تورد رومستاد Tord Romstad، وماركو كوستالبا Marco Costalba، وجونا كيسكي Joona Kiiski، وغاري لينسكوت Gary Linscott.
خطط Costalba للمشروع بدايةً من الإصدار 2.1 من محرّك Galaurng، والذي طوّره Romstad في الأصل وأصدره أولَ مرة في خريف 2004، وهكذا أُعلِن عن Stockfish في نوفمبر 2008، وصعد بقوّة ليصبح في عام 2018 أحد أقوى الكيانات الشطرنجية (1).
في العام 2011، تنحى كلٌّ من Costalba وKiiski بصفتهما مسؤولين عن Stockfish، تاركين عملية تطويره وصيانته والحفاظ عليه مسؤولية ما يسمى "مجتمع Stockfish".
ولمّا كان Stockfish قد كُتِب بلغة ++C؛ فبالإمكان تجميعه وبنائه من قبل مختلف المعالجات وأنظمة التشغيل؛ مثل الأندرويد، وIOS، ولينوكس Linux، وويندوز windows، وOS X، وقد طُوِّر لاحقًا لأنظمة ماكنتوش Macintosh (1).
يستخدم Stockfish خوارزمية MiniMax التي تعتمد على إيجاد كل النقلات الممكنة من وضعية معينة، ومن ثم اختيار الأفضل، والمقصود بالأفضل هنا هي الخطوة التي تحقق أعلى مكسب وأقل خسارة، باعتبار أنّ الخصم سينجز الحسابات نفسها لخطوته، ولذلك؛ ما يهم في هذه الخوارزمية هو العمق أو كم هو عدد النقلات التي يمكن للحاسب تفحصها (5).
شعار ستوك فيش الذي صممه Klein Maetschke
ألفا زيرو (AlphaZero)
قُدِّم في 2017 بوصفه نظامًا آليًّا التعلم من الصفر لكل من الشطرنج والشطرنج الياباني (Shogi) ولعبة Go الصينية، وقد أذهل العالم والاختصاصيين بقدراته وطريقة لعبه التي تختلف عن أي محرك لعب شطرنجي آخر (2).
علَّم AlphaZero نفسه ليصبح أحدَ أقوى اللاعبين في التاريخ عن طريق التدرب العشوائي دون تضمين أي مجال معرفي، بل القواعد الأساسية في اللعبة فقط (2).
بخلاف محركات الشطرنج التقليدية -متضمنةً Stockfish وDeep Blue- التي تعتمد على الآلاف من القواعد التي صمّمها أقوى لاعبي العالم لحساب كل احتمالية ضمن اللعبة؛ يتّبع AlphaZero نهجًا مختلفًا، فقد استُبدِلت بهذه القواعد المُصاغة يدويًّا؛ شبكة عصبونية عميقة وخوارزميات للأغراض العامة لا تعرف شيئًا عن اللعبة سوى القواعد الأساسية (2).
ولكي تتعلم؛ تلعب الشبكة العصبونية غير المدرّبة ملايين المباريات ضد نفسها عن طريق عملية تدعى التعلم المعزز (Reinforcement learning) (التجربة والخطأ)، ففي البداية يكون اللعب عشوائيًّا جدًّا، ولكن مع الوقت يتعلم النظام -من خلال الربح والخسارة والتعادل- ضبطَ بعض المعاملات ضمن الشبكة العصبونية؛ مما يجعلها أكثر قابلية لاختيار الحركات الرابحة في المستقبل، ويعتمد مقدار التدريب على أسلوب اللعبة وتعقيدها (2).
تُستخدَم الشبكة المدربة من أجل توجيه خوارزمية البحث المعروفة بـ "شجرة مونتي كارلو للبحث Monte-Carlo search tree" لاختيار الحركات الأفضل في اللعبة، ولكل خطوة يبحث AlphaZero في قرابة 60 ألف حركة في الثانية، مقابل 60 مليون حركة في محركات البحث الشطرنجية مثل Stockfish.
والجدير بالذكر أنّ AlphaZero فاز بـ155 مباراة من أصل 1000 مباراة لعبها مع Stockfish، في حين فاز الأخير بـ6 مباريات فقط، وانتهى الباقي بالتعادل، وذلك في الموسم التاسع من بطولة TCEC 2016 .(2)
يزداد التعقيد كلما تقدم العلماء في عمليات البحث وتطوير الخوارزميات، إضافة إلى التطور السريع في العَتاد الصلب الخاص بأجهزة الحاسب من معالجات وسرعة حوسبة وغيرها، فهل ستتفوق الآلات على البشر يومًا ما في لعبتهم الشهيرة؟
هوامش:
لمعرفة المزيد عن آلان تورينغ Alan Turing؛ هنا
المصادر:
2- AlphaZero: Shedding new light on the grand games of chess، shogi and Go [Internet]. Deepmind. [cited 29 May 2020]. Available from: هنا
3- Home - Stockfish - Open Source Chess Engine [Internet]. Stockfishchess.org. [cited 29 May 2020]. Available from: هنا;
4- IBM100 - Deep Blue [Internet]. Ibm.com. [cited 29 May 2020]. Available from: هنا;
5- Rin.io. 2014. How Stockfish Works: An Evaluation Of The Databases Behind The Top Open-Source Chess Engine – Good Fibrations. [online] Available at: <هنا; [Accessed 12 July 2020].
6- GitHub. n.d. Official-Stockfish/Stockfish. [online] Available at: <هنا; [Accessed 12 July 2020].