أهميّة لعبة البوكر للذّكاء الصّنعيّ
المعلوماتية >>>> الذكاء الصنعي
قد يُثبتُ برنامجُ حاسوبٍ يُدعى ليبراتوس (libratus) أخيراً أنَّ الحواسيبَ تستطيعُ أن تلعبَ الورقَ بشكلٍ أفضلَ من أيِّ لاعبٍ بشريٍّ.
يلعبُ ليبراتوس حاليّاً الآلافَ من ألعابِ الورقِ المُختلفةِ ضدَّ عددٍ من اللاّعبينَ المحترفينَ. والآن وفي مُنتَصَفِ مسابقةٍ مُدّتها عشرون يوماً، تقدّم ليبراتوس بأكثرَ من 800000$ على خصومه من البشر.
فوزُ ليبراتوس سيكونُ إنجازاً ضخماً للذّكاءِ الصُّنعيِّ نظراً لما تتطلّبه لعبةُ البوكر من المحاكاة المنطقيّةِ والذّكاءِ الّذي تمَّ إثباتُ صعوبَةِ محاكاةِ الآلاتِ لَهُ.
تختلفُ لُعبةُ البوكر بشكلٍ جذريٍّ عن الألعابِ الّتي تعاملَ معها الذّكاء الصُّنعيُّ سابقاً مثل ألعابِ الشّطرنجِ والدّاما ولعبةِ "Go " اللُّعبة الصّينيّة القديمة، لأنّ أوراقَ الخصمِ تبقى مخفيّةً أثناءَ اللُّعبة. ومن الصّعبِ جداً في ألعابِ المعلوماتِ النَّاقصةِ كالبوكر استنتاجُ الاستراتيجيّةِ المثاليّةِ لكلِّ طريقةٍ قد يقومُ الخصمُ باستخدامِها للّعب، وتُشكِّلُ اللُّعبةُ المسمّاةُ "no-limit Texas hold’em" أيضاً تحدّياً كبيراً لأنّ الخصمَ يستطيعُ المراهنةَ بأيِّ مقدارٍ من المال.
اقرأ أيضاً:الذّكاء الصُّنعيُّ يُتقن لعبةً صينيّةً تعود إلى 2500 سنة! (هنا)
يقولُ أندرو (Andrew NG) كبيرُ العلماءِ في مُحرِّكِ البحثِ الصِّينيِّ بايدو(baidu) "لطالما كانت لعبةُ البوكر واحدةً من أصعبِ الألعابِ للفهمِ بالنِّسبةِ للذّكاءِ الصُّنعيِّ، لا توجدُ حركةٌ مثاليّةٌ واحدةٌ، ولكن عِوضاً عن ذلكَ، يجبُ على الذّكاءِ الصُّنعيِّ أن يجعلَ حركاتِه تبدو عشوائيّةً حتّى لا يستطيع الخصمُ اكتشافَ حركاتِ التّضليل".
تمَّ إنشاءُ برنامجِ ليبراتوس من قِبَلِ بروفيسور في علومِ الحاسوبِ في جامعةِ كارنجي ميلون(CMU: Carnegie Mellon University) وخبيرٌ في نظريّة الألعاب(game theory) والذّكاءِ الصُّنعيِّ يُدعى توماس ساندهولم (Tuomas Sandholm) بالتّعاونِ مع طالِبِه(Noam Brown).
يقولُ البروفيسور ساندهولم أنَّهُ من المذهلِ كيف استطاعَ البشرُ التّفوّقَ على الآلاتِ لهذا الوقتِ الطّويلِ، فمن بينِ كلِّ الألعابِ الّتي تعاملَ معها الذَّكاءُ الصُّنعيُّ سابقاً، بقيت لعبة البوكر اللُّعبةَ الوحيدةَ الّتي لم يستطع أن يصلَ فيها إلى قدراتٍ خارقةٍ.
يستخدمُ علماءُ الذَّكاءِ الصُّنعيِّ (نظريّة الألعابِ: صنعُ القرارِ الاستراتيجيِّ باستخدامِ الرّياضيات) لإيجادِ أفضلِ استراتيجيّةٍ تّأخذُ بالاعتبارِ العديدَ من العواملِ غيرِ المؤكّدةِ، تُسمّى هذه الاستراتيجيّة بحالةِ التّوازن(equilibrium). ولأنّ عددَ الاحتمالاتِ كبيرٌ جدّاً، تستخدمِ هذه الطريقةُ أيضاً نوعاً من التّقريب.
يقولُ فينسنت كونيتزر(Vincent Conitzer) بروفيسور في الذّكاء الصُّنعيِّ ونظريّة الألعاب من جامعةِ دوك (Duke University) "تعتمدُ معرفةُ مقدارِ صحّةِ حركةٍ ما على عواملَ لا يمكن رصدها، ويُنتِج هذا أيضاً حاجةً إلى أن تكونَ غيرَ متوقّعٍ في حركاتِك .لن تكونَ لاعباً جيّداً إن لم تقم بالتّضليل مُطلقاً وكذلكَ الأمرُ إن كنتَ تُضلّلُ دائماً. حيث تقولُ لكَ نظريّةُ الألعابِ كيف تجعلُ لعبتَكَ عشوائيّةً بطريقةٍ تبدو مثاليّةً".
في السّنةِ الماضيةِ، قادَ البروفيسور ساندهولم تطويرَ برنامجٍ سابقٍ يلعبُ البوكر، كانَ هذا البرنامجُ يُدعى كلاوديكو (Claudico)، لكنّ كلاوديكو هُزِِمَ بمرارةٍ مراتٍ عديدةً على يدِ عددٍ من محترفي اللُّعبة. ويُفسّرُ ساندهولم فشلَ كلاوديكو ونجاحَ ليبراتوس بأنَّ ليبراتوس يستخدمُ العديدَ من التَّطويراتِ الّتي سمحت له بتحقيقِ هذا المستوى العالي من اللّعب. تتضمّنُ هذه التّطويراتِ تقنيّةً جديدةً من تقريبِ حالةِ التّوازن بالإضافةِ إلى طُرُقٍ لتحليلِ المخرجاتِ المتوقّعةِ في الوقتِ الّذي تُكشَف فيه أوراقٌ جديدةٌ في مراحلَ لاحقةٍ من اللُّعبة. يُمثّل هذا التّحليلُ والّذي يُسمّى تحليل نهايةِ اللّعبة تحدّياً حسابيّاً كبيراً، ولذلك يُنَفَّذُ خلالَ كلِّ لعبةٍ في مركزِ بيتسبورغ للحوسَبَةِ الفائقةِ، وهي مُنشأة يتمُّ تشغيلها من قِبَلِ جامعةِ كارنجي ميلون وجامعةِ بيتسبورغ.
برامجُ مشابهةٌ:
فتحتِ التّطوّراتُ في تعلُّم الآلة والذّكاء الصُّنعيِّ المجالَ لظهورِ العديدِ من برامجِ لعبٍ بقدراتٍ فوق بشريّة. في السّنةِ الماضية، طوّرَ الباحثونَ في مشروعِ ديب مايند (DeepMind : شركةٌ فرعيّةٌ من شركةِ Alphabet الّتي تملكُ محرِّك البحث Google) برنامجاً قادراً على هزمِ أحدِ أفضلِ اللّاعبين في لُعبة جو(Go). صُنِّف هذا الإنجازُ بالمذهلِ نظراً للتّعقيدِ الكبيرِ في هذه اللّعبةِ "العتيقةِ" وصعوبةِ قياسِ التّقدّمِ خلالَها.
تقومُ العديدُ من المجموعاتِ البحثيّةِ بالتّركيزِ على لُعبة البوكر. قام فريقٌ أكاديميٌّ آخرُ من جامعةِ ألبيرتا (Alberta) في كندا وجامعةِ تشارلز(Charles) وجامعةِ التّشيك التّقنيّة اللّتين تقعان في جمهوريّةِ التّشيك، بتطويرِ برنامجٍ يُدعى ديب ستاك (DeepStack)، والّذي هزمَ سابقاً عدداً من اللّاعبينَ المحترفينَ في ألعابِ بوكر مختلفةٍ، غيرَ أنّ البروفيسور ساندهولم قالَ إنّ اللاعبين الّذين ينافسون برنامَجَهُ (ليبراتوس) أكثرَ احترافاً بكثيرٍ مقارنةً باللاعبين الّذين هزمَهم برنامجُ ديب ستاك بالإضافةِ إلى أنَّ منافسي ليبراتوس يلعبونَ توزيعاتِ ورقٍ أكثرَ بكثيرٍ ممّا يزيد الأهميّةَ الإحصائيّةَ في النّتيجةِ النّهائيّةِ.
التّطبيقاتُ في الحياةِ الواقعيّة:
التّقنياتُ المُستخدمةُ في تطويرِ برنامجِ لعبِ بوكر أذكى ويمكنُ أن تُستَخدَمَ في الكثيرِ من تطبيقاتِ الحياةِ الواقعيّةِ. فقد تمَّ تطبيقُ نظريّةِ الألعابِ فعلاً على أبحاثٍ سابقةٍ عن هجماتِ التّشويشِ والأمنِ الإلكترونيِّ والتّوجيه الآليِّ لسيّاراتِ الأجرةِ والتّخطيط الرُّوبوتيِّ.
وعلى أيِّ حالٍ، حتّى لو استطاعَ ليبراتوس أن يهزمَ جميعَ خصومِهِ ويربحَ المسابقةَ لاحقاً هذا الأسبوع فلن يعني ذلك أنّ البشرَ لم يعد لهم مكانٌ على طاولةِ الورقِ لأنَّ التِّقنيّاتِ الّتي يستخدمُها ليبراتوس لا يمكنُها حتّى الآنَ احترافُ الألعابِ مُتعدّدةِ اللّاعبِينَ.
-----------------------------------------------
للمزيد عن نظريّة الألعاب:
هنا
هنا
-----------------------------------------------
المصدر:
هنا