خوارزمية لترتيب الجامعات بالاعتماد على ويكيبيديا
المعلوماتية >>>> الذكاء الصنعي
المشكلة هي أنه من الصعب القيامُ بأي تصنيف موضوعي لأي شيء، ناهيك عن الجامعات؛ فالعوامل الثقافية والتاريخية والجغرافية كلها يمكن أن تؤثرَ على عملية التصنيف بحيث يصبحُ من الصعب قياسُها، لذلك فإن وجودَ طريقةِ تصنيفٍ تتجنب هذه الخلافات سيكون مرحباً بها بالتأكيد.
اليوم، أصبحت لدينا هذه الطريقةُ بالفعل! فقد قام «جوزيه لاجيز» وعددٌ من زملائه في جامعة "Franche-Comte" في فرنسا، بالاستفادة من ذكر الجامعات في موقع ويكيبيديا ليولدوا من خلالها تصنيفًا عالميًا. توفّرُ نتائجُ البحث طريقةً جديدة للتفكير بعملية التصنيف، والتي يمكنُ أن تساعدَ على تجنب الانحياز الذي يمكن أن يحصلَ في أنظمة التصنيف الأخرى. ولكن كيف يحصل هذا الانحياز؟ على سبيل المثال فإن اللغةَ الإنكليزية في القرن الأخير أصبحت هي لغة العلوم، والأفضليةُ التي تمنحها هذه الميزة للبلاد التي تتكلم الإنكليزية غير قابلة للقياس.هناك أيضًا بعضُ العوامل المميزة بعملية تصنيف الجامعات. بعض المعاهد تركز مثلًا على التعليم أكثر من الأبحاث، فكيف يمكن القيام بمعادلة هذه العوامل؟
يهدفُ هذا البحث الجديد إلى التغلب على بعض هذه المشاكل باستخدام خوارزمية بيجرانك (pagerank) الشهيرة التي تستخدمها «غوغل» لتصنيف نتائج البحث، والتي تستخدمُ شبكةً من الروابط بين العقد لتحدد الأكثر أهمية منها. النقطةُ الرئيسية هي أن الخوارزميةَ تقوم باعتبار العقدة مهمة حين تشير إليها عقد مهمة أخرى. لذلك فهي تعمل بشكل متكرر من خلال الروابط لتعيدَ حساب أهمية كل عقدة في الشبكة في كل دورة، لتستخلص التصنيف في النهاية.
يمكنُ تطبيقُ هذه العملية بالذات على مقالات ويكيبيديا؛ كل إشارة إلى جامعة في مقال هو عبارة عن عُقدة في الشبكة، والروابط التي تشير إليها هي ما يُستخدم في تحديد تصنيفها.
طبّق «لاجيز» ورفاقه هذه العملية على 24 لغةً مختلفة من إصدارات ويكيبيديا. قاعدة البيانات هذه تحوي حوالي ٤ ملايين مقالة باللغة الإنكليزية و1.5 مليون مقال باللغة الألمانية وحوالي المليون في كل من الفرنسية والهولندية والإيطالية والأسبانية والروسية. كما أنها تحوي أيضا اللغاتِ العبريةَ والصينية والهنغارية... إلخ.
هذه الـ24 لغة تغطّي حوالي 59٪ من سكان العالم و68٪ من إجمالي المقالات المكتوبة في ويكيبيديا في كل اللغات الـ287 المتاحة.
يقوم الفريق أولاً بالتصنيف لكل لغة على حدة، ويقوم بالتنويه بأن كلَّ لغة تميل إلى تفضيل جامعاتها. فترتيب الـ100 جامعة الأولى للغة الفرنسية يتضمن 32 جامعةً ناطقة بالفرنسية، وكذلك بالنسبة للغة الألمانية نجدُ 63 جامعة ناطقة بالألمانية ضمن الـ100 جامعة الأوائل، وهكذا.
في النهاية يجري دمجُ هذه النتائج مع بعضها للحصول على تصنيف عالمي. الجامعات الـ20 الأولى التي صُنِّـفـت بهذه الطريقة هي:
1. University of Cambridge U.K.
2. University of Oxford U.K.
3. Harvard University U.S.
4. Columbia University U.S.
5. Princeton University U.S.
6. Massachusetts Institute of Technology U.S.
7. University of Chicago U.S.
8. Stanford University U.S.
9. Yale University U.S.
10 University of California, Berkeley U.S.
11. Humboldt University of Berlin, Germany
12. Cornell University U.S.
13. University of Pennsylvania U.S.
14. University of London U.K.
15. Uppsala University Sweden
16. University of Edinburgh U.K.
17. Heidelberg University Germany
18. University of California, Los Angeles U.S.
19. New York University U.S.
20. University of Michigan U.S.
يمكنك الاطلاع على الـ100 كاملة من خلال هذا الرابط: هنا
هناك الكثير من الأسماء المألوفة في هذه القائمة، لكن هناك أيضاً اختلاف مثير للاهتمام مع طرق التصنيف التقليدية. ربما الأكثر تأثيراً بين هذه التصنيفات هو التصنيف الأكاديمي لجامعات العالم الذي أعدته جامعة شنغهاي (Shanghai Jiao Tong) عام 2003.
الـ20 جامعة الأفضل حسب هذا التصنيف (من عام 2013 عندما تم تحليل قاعدة بيانات ويكيبيديا) هي كالتالي:
1. Harvard University U.S.
2. Stanford University U.S.
3. University of California, Berkeley U.S.
4. Massachusetts Institute of Technology U.S.
5. University of Cambridge U.K.
6. California Institute of Technology U.S.
7, Princeton University U.S.
8. Columbia University U.S.
9. University of Chicago U.S.
10. University of Oxford U.K.
11. Yale University U.S.
12. University of California, Los Angeles U.S.
13. Cornell University U.S.
14. University of California, San Diego U.S.
15. University of Pennsylvania U.S.
16. University of Washington U.S.
17. The Johns Hopkins University U.S.
18. University of California, San Francisco U.S.
19. University of Wisconsin, Madison U.S.
20. Swiss Federal Institute of Technology Zurich, Switzerland
قام «لاجيز» ورفاقه بتسجيل بعض الملاحظات المثيرة للاهتمام. في البداية، أشاروا إلى أن قائمةَ ويكيبيديا تقوم بتفضيل الجامعات الأقدم والتي لها تأثيرٌ ثقافيٌّ أكبر. على سبيل المثال فإن جامعةَ هومبولدت في برلين (Humboldt University of Berlin) مصنفة في المرتبة الـ11 على قائمة ويكيبيديا، لكنها ليست في المراتب الـ100 الأولى على قوائم طرق التصنيف التقليدية، وهو شيءٌ مفاجئ بالنسبة لجامعة درّست 29 فائزًا بجائزة نوبل. يُعلَّل سبب انضمامها للتصنيف الجديد نظراً للأهمية الثقافية والتاريخية الكبيرة لهذه الجامعة في مجال الفن والعلوم الانسانية أكثر من باقي العلوم.
التنوع البلداني هو أكبر أيضًا في قائمة ويكيبيديا، بما يشمل مثلًا من جامعات إفريقية كجامعة الأزهر في مصر. كما أن الجامعات اليابانية والهندية لها حضور أكبر أيضًا هنا. وتأتي ألمانيا في المرتبة الثانية في أعلى البلدان تصنيفًا بعد الولايات المتحدة وتليها بريطانيا.
على النقيض فإن الطرقَ التقليدية تصنفُ الولايات المتحدة أولًا تليها بريطانيا وثالثًا تأتي أستراليا. بشكل عام فإن جامعاتِ الولايات المتحدة أقل سيطرة في التصنيف الجديد بـ38٪ من المجموع الكلي. بينما أكثر من نصف الجامعات هي أمريكية حسب التصنيفات التقليدية.
المخطط التالي يبين توزيع الجامعات بحسب الخوارزمية الجديدة:
Image: https://www.technologyreview.com/s/544266/wikipedia-mining-algorithm-reveals-worlds-most-influential-universities/
التصنيف الجديد ليس كاملاً بالطبع، فهو يصنّف جامعةَ لندن في المرتبة الـ14 على الرغم من أن هذه الجامعة هي عبارة عن تجمع عدة معاهد مثل "University College London" و"Kings College London" والتي لها تصنيفها الخاص في القائمة. كما أن قاعدةَ البيانات لا تشمل لغاتٍ مثل الأوكرانية، والتي حتمًا ستضيف انحيازًا جديدًا. بالإضافة إلى أن مقالات ويكيبيديا مفتوحة وهي عرضة لسوء الاستخدام، مما يتيح المجالَ للتصنيفات المستقبلية بأن تتأثرَ بالممارسات الخاطئة.
على الرغم من ذلك فإن التصنيفَ الجديد تحسب له الموضوعية. فيما تقلل الجامعاتُ عمومًا من أهمية هكذا تصنيفات، إلا أنه يمكن أن يكونَ لها تأثير كبير على التمويل. الاستراتيجية الفرنسية نحو أبحاث وتعليم أعلى، يُعتقد بأنها تتأثر بشكل كبير بتصنيف شنغهاي (والذي يفسر الاهتمام بهذا الموضوع)
بالطبع فإنه من غير المتوقع أن تستبدلَ تصنيفاتُ ويكيبيديا التصنيفاتِ التقليدية، ولكنها تقدم طريقةً جديدة في تحليل المعطيات الراهنة ويجب أن تشكلَ إضافةً مهمة إلى الجدل القائم في هذا المجال بطريقة مفيدة.
المصادر:
1- ملخص الدراسة: هنا
2- هنا