من قال أنه من الضروري احترام قواعد الفوز بلعبة الفشل؟ بالتأكيد ليست أحدث نماذج الذكاء الاصطناعي ، والتي تسمى “نماذج التفكير”.
هذا ما يوضح دراسة – التي لم تمر بعد من خلال دائرة إعادة قراءة من قبل أقرانها – طلب من الباحثين من سبعة نماذج رئيسية من اللغة (LLM) لعب مئات الأجزاء من لعبة الدرج هذه ضد أسماك البورصة ، وهو محرك شطرنج قوي مفتوح المصدر.
لم تتردد نماذج O1-Preview للشركة الأمريكية Openai و R1 من Deepseek الصينية في الغش ، دون أن تتم دعوتها ، أو حتى معتمدة. هذان النموذجان من الذكاء الاصطناعى من بين أول من استخدموا ، على نطاق واسع ، تقنية التعلم التلقائي المعروفة باسم “التعزيز عن طريق التعزيز” ، والتي ليست راضية عن تقليد اللغة البشرية من خلال التنبؤ بالكلمة التالية ، ولكن يمكن أن “سبب” باستخدام طرق اختبار الاختبار.
“يشير هذا العمل إلى أنه كلما كان نموذج الذكاء الاصطناعي أكثر إتقان ، زاد احتمال محاولة اختراق قواعد اللعبة من أجل هزيمة خصمها” ، يؤكد معهد ماساتشوستس للتكنولوجيا مراجعة. على سبيل المثال ، حذفت طرز O1 أو R1 الأجزاء من الخصم عن طريق السيطرة على لوحة الشطرنج ، وتحويل نسخة من أسماك البورصة بالتوازي لسرقة منه أو حاول استبدالها بمحرك شطرنج آخر أقل كفاءة.
لا ترس وغير أخلاقي
طلب الباحثون نموذج IA O1 لشرح …