تم الكشف مؤخرًا عن Polyphony Digital صوفي غران توريزمونظام تجريبي جديد للذكاء الاصطناعي سيظهر في جران توريزمو 7. تم تطوير التكنولوجيا بالتعاون مع فريق مكون من 25 شخصًا في Sony AI ، باستخدام أحدث التطورات في التعلم الآلي. تم نشر بحث الفريق في طبيعة و GT Sophy تم اختباره (وهزيمته!) لبعض أفضل متسابقي Gran Turismo في العالم في حدث مباشر في طوكيو العام الماضي.
ومع ذلك ، فإن كشف GT Sophy أثار العديد من الأسئلة تقريبًا كما أجاب. كيف بالضبط تعمل التكنولوجيا؟ كيف سيتم دمجها في الواقع GT7وما نوع القيود التي لديها؟
للمساعدة في الإجابة على كل هذه الأسئلة ، قمنا بدراسة طبيعة المنشور وتحدث مع صانع سلسلة Gran Turismo Kazunori Yamauchi ومدير Sony AI America بيتر ورمان في مقابلة حصرية. هذا ما تعلمناه.
كيف تعمل صوفي بالفعل
بصفتها “لاعبًا” ، ترى صوفي البيئة الافتراضية لـ Gran Turismo كخريطة ثابتة ، مع تحديد الخطوط اليسرى واليمنى والوسطى كنقاط ثلاثية الأبعاد. يتم تقسيم المسار أمام Sophy إلى 60 مقطعًا متساوي الأبعاد ، ويتم حساب طول كل مقطع ديناميكيًا بناءً على سرعة السيارة. يمثل كل مقطع ما يقرب من 6 ثوانٍ من السفر في أي وقت.
تتمتع Sophy أيضًا بإمكانية الوصول إلى معلومات معينة حول ما تفعله السيارة في بيئتها ، بما في ذلك السرعة ثلاثية الأبعاد ، والسرعة الزاوية ، والتسارع ، والحمل على كل إطار ، وزوايا انزلاق الإطارات. كما أنه على دراية بتقدم السيارة على طول المسار ، وميل سطح المسار واتجاه السيارة بالنسبة للخط المركزي للمسار والحواف الأمامية. يتم تحذير Sophy من قبل اللعبة إذا اتصلت السيارة أو تحركت خارج حدود المسار الافتراضية للعبة.
فيما يتعلق بالأوامر ، لا تتمتع Sophy إلا بإمكانية الوصول إلى دواسة الوقود والفرامل ومدخلات التوجيه اليسرى / اليمنى. يمكنه فقط تغيير هذه المدخلات بمعدل 10 هرتز ، أو حوالي كل 100 مللي ثانية. لا يمكنه الوصول إلى التبديل أو التحكم في الجر أو توازن الفرامل أو أي إعدادات أخرى متاحة عادةً للاعبين البشر.
يتم تقديم هذه المتغيرات البيئية والمدخلات المحدودة إلى صوفي ، ثم تبدأ في العمل. باستخدام خوارزميات التعلم الآلي المتقدمة ، فإنه يقود المسار مرارًا وتكرارًا. Il est “récompensé” – mathématiquement parlant – en progressant sur la piste en aussi peu de temps que possible, et “puni” – encore une fois, mathématiquement parlant – s’il entre en contact avec les murs, d’autres voitures ou sort حدود.
أوضح بيتر ورمان ، مدير Sony AI America: “تم تدريب GT Sophy باستخدام التعلم المعزز”. “لقد منحناه بشكل أساسي مكافآت للتقدم على المسار أو تجاوز سيارة أخرى ، وعقوبات على الخروج عن المسار أو الاصطدام بسيارات أخرى. وللتأكد من أنه تعلم التصرف في سيناريوهات السباقات التنافسية ، وضعنا الوكيل في العديد من مواقف السباق المختلفة مع عدة أنواع مختلفة من المعارضين ، ومع التدريب الكافي ، من خلال التجربة والخطأ ، كان قادرًا على تعلم كيفية الرد على السيارات الأخرى. كان هناك خط رفيع جدًا بين أن تكون عدوانيًا بما يكفي لتحمل مسارك الخاص وأن تكون عدوانيًا جدًا وتسبب حوادث والحصول على العقوبات.
ذهب ورمان إلى تحديد أصعب التحديات في معالجة البيانات. كان الجزء الأصعب هو معرفة كيفية تقديم هذه المعلومات إلى الشبكات العصبية بالطريقة الأكثر فاعلية. على سبيل المثال ، من خلال التجربة والخطأ ، وجدنا أن ترميز ما يقرب من 6 ثوانٍ من المسار القادم كان بمثابة معلومات كافية لـ GT Sophy لاتخاذ قرارات بشأن مسارات عملها “، أوضح. “كان التحدي الكبير الآخر هو الموازنة بين المكافآت وعروض الجزاء لإنتاج وكيل كان عدوانيًا ولاعبًا جيدًا.”
تقوم Sophy بكل هذا في الوقت الفعلي ، على PlayStation 4s الحقيقية التي تعمل بإصدار خاص من Gran Turismo Sports التي تُبلغ عن بيانات الموقع المطلوبة وتقبل مدخلات الأمر عبر اتصال الشبكة. يتم تنفيذ كود Sophy بواسطة خوادم تتواصل مع PlayStations عبر الشبكة. للمساعدة في تسريع العملية ، تتحكم Sophy في 20 سيارة على المسار في نفس الوقت. يتم تغذية النتائج في الخوادم المدعومة بشرائح NVIDIA V100 أو A100 ، ووحدات معالجة الرسومات على مستوى الخادم المصممة لمعالجة بيانات الذكاء الاصطناعي والتعلم الآلي.
من المهم أن نلاحظ أن هذا النوع من قوة الحوسبة مطلوب فقط لـ “إنشاء” Sophy ، وليس لتشغيلها. تؤدي عملية التعلم الآلي في النهاية إلى “نماذج” يمكن تشغيلها بعد ذلك على أجهزة أكثر تواضعًا.
أوضح Kazunori Yamauchi: “تتم معالجة تعلم Sophy بالتوازي باستخدام موارد الحوسبة السحابية ، ولكن إذا كنت تقوم بتشغيل شبكة مكتسبة بالفعل ، فإن PS5 المحلي يكون أكثر من كافٍ”. “عدم تناسق قوة الحوسبة هذه هو سمة عامة للشبكات العصبية.”
كيف تختلف صوفي
لطالما كان الذكاء الاصطناعي في ألعاب السباقات نوعًا من “الصندوق الأسود”. نادرًا ما يناقش مطورو الألعاب كيفية عملها في الواقع ، لكنها جزء مهم من ألعاب السباق التي يتفاعل معها جميع اللاعبين. كنا فضوليين لمعرفة المزيد حول كيفية عمل الذكاء الاصطناعي في Gran Turismo في الماضي وما الذي يجعل Sophy مختلفة تمامًا.
كما أوضح لنا Kazunori Yamauchi ، فإن عملية التعلم الآلي تزود Sophy بقواعد سلوكية أكثر مما يمكن للمبرمجين البشريين تصوره ، ولكن هذه الاستراتيجية لها أيضًا عيوبها الخاصة.
يقول Yamauchi-san: “حتى الآن ، كان الذكاء الاصطناعي قائمًا على القواعد ، لذا فقد كان يعمل بشكل أساسي كبرنامج if-then”. “ولكن بغض النظر عن عدد هذه القواعد المضافة ، لا يمكنها التعامل مع ظروف وبيئات أخرى غير تلك المحددة. من ناحية أخرى ، تولد Sophy قدرًا هائلاً من القواعد الضمنية التي لا يستطيع البشر التعامل معها ، داخل طبقة شبكتها. نتيجة لذلك ، فهي قادرة على التكيف مع الظروف والبيئات المختلفة. ولكن نظرًا لأن هذه القواعد ضمنية ، فهذا يعني أنه من غير الممكن جعلها تتعلم “سلوكًا محددًا” يكون بسيطًا للذكاء الاصطناعي القائم على القواعد.
كيف ستظهر Sophy في جران توريزمو 7
على الرغم من أن صوفي قد تم تطويره خلال السنوات القليلة الماضية باستخدام Gran Turismo Sportsالتكنولوجيا ستظهر لأول مرة في الواقع جران توريزمو 7 في تحديث مستقبلي للعبة. كان إعلان Kazunori Yamauchi خفيفًا على التفاصيل ، لذلك كان شيئًا نتطلع إلى سؤاله عنه.
وأوضح ياماوتشي سان: “من المرجح أن تظهر صوفي أمام اللاعب بثلاثة أشكال”. “بصفتي مدرسًا سيعلم اللاعبين كيفية القيادة ، وكطالب سيعلم الروح الرياضية للاعبين ، وكصديق لأتسابق معه. لن أستبعد إمكانية وضع المواصفات B ، حيث يكون اللاعب هو السباق المخرجة وصوفي هي السائق.
يمكن أيضًا استخدام Sophy كأداة في اللعبة نفسها. وأضاف ياماوتشي: “من حيث المبدأ ، من الممكن استخدام Sophy لمعلمات مانع الانفجار BOP”. “إذا كان الأمر يتعلق فقط بمحاذاة أوقات دورات السيارات المختلفة ، فمن الممكن فعل ذلك الآن. ولكن نظرًا لأن إعدادات BoP لا تتعلق فقط بأوقات الدورات ، فلن نترك كل شيء لـ Sophy ، لكنها ستكون بالتأكيد مساعدة في إنشاء BoPs.
ما زالت صوفي تتعلم
بمجرد الكشف عن Sophy ، كان لدينا فضول لمعرفة المزيد عن حدودها. يدرك فريق Sony AI تمامًا كيف يمكن أن تتحسن Sophy ولا تزال التكنولوجيا نفسها قيد التطوير النشط.
على سبيل المثال ، في نسختها الحالية ، يتم تدريب Sophy على مسارات محددة في ظروف محددة ، لكن الفريق يتوقع أن تكون التكنولوجيا قادرة على التكيف. وأوضح ورمان قائلاً: “تم تشكيل هذه الإصدارات من GT Sophy لمجموعات محددة من مسارات السيارات”. “يعد تحسين الوكيل على القيادة أيضًا من خلال تعديل أداء السيارة جزءًا من عملنا المستقبلي. لم يتم تدريب هذا الإصدار من GT Sophy أيضًا على الاختلافات البيئية ، لكننا نتوقع أن تستمر التقنيات في العمل في هذه الظروف.
عندما ظهرت صوفي كطيار خارق قادر على هزيمة أفضل لاعبي Gran Turismo في العالم ، ظهرت أسئلة ومخاوف على الفور حول قدرتها على التكيف مع الطيارين البشريين الأقل قدرة على المنافسة.
وفقًا لـ Peter Wurman ، يمكن لـ Sophy التكيف من خلال القيادة حرفيًا مثل السائق الجديد بدلاً من مجرد التباطؤ المصطنع. وأوضح مدير Sony AI America: “إنه أيضًا جزء من عملنا المستقبلي”. “هدفنا هو إنشاء وكيل يقود ، عندما يكون في الوضع” البطيء “، كسائق أقل خبرة ، بدلاً من أن يكون معوقًا بطريقة ما ، مثل تسريعها أو إبطائها. بشكل تعسفي في انتهاك للفيزياء.”
كان الهدف الأصلي لشركة Sony AI هو تطوير الذكاء الاصطناعي الأسرع والأكثر قدرة على المنافسة ، والذي يمكنهم بعد ذلك البناء عليه لتطوير أداة أكثر تنوعًا تجعل اللعبة أكثر إمتاعًا للجميع. “كان هدفنا في هذا المشروع هو إظهار أنه يمكننا إنشاء وكيل يمكنه التسابق مع أفضل اللاعبين في العالم. هدفنا النهائي هو إنشاء وكيل يمكنه تزويد اللاعبين من جميع الأنواع بتجربة سباق مثيرة” ، أكد فورمان .
المزيد من التفاصيل
عادةً ما يتم حماية البحث والتطوير الذي يدخل في ألعاب الفيديو الحالية – وخاصة ألعاب Gran Turismo – باعتباره أسرارًا تجارية. هذا يجعل شفافية تطوير Sophy أكثر انتعاشًا ورائعة بشكل لا يصدق للمهتمين.
إذا كنت ترغب في التعمق أكثر ومعرفة المزيد حول الأعمال الداخلية لـ Sophy ، فيمكنك قراءة الورقة البحثية الكاملة التي راجعها النظراء في عدد 10 فبراير 2022 من طبيعة مجلة علمية. المقال والملخص متاح للتنزيل مع الاشتراك. للوصول المجاني إلى طبيعةتحقق من مكتبتك أو جامعتك المحلية.
نحن على يقين من سماع المزيد عن Sophy بعد GT7في 4 مارس 2022. كما هو الحال دائمًا ، سنراقب عن كثب أي أخبار فور الكشف عنها. ابق في الاستماع!
شاهد المزيد من المقالات حول Gran Turismo Sophy و Kazunori Yamauchi.
Social media junkie. Zombie fanatic. Travel fanatic. Music obsessed. Bacon expert.