طباعة الصفحة - وضوح نيوز

نعرض لكم زوارنا أهم وأحدث الأخبار فى المقال الاتي:
أي نموذج أذكى؟ مقارنة بين GPT-5.2 وغروك 4.1 - وضوح نيوز, اليوم الاثنين 15 ديسمبر 2025 02:45 مساءً

أعلنت شركة "أوبن إيه آي" عن إطلاق نموذجها الجديد GPT-5.2 في خطوة تهدف إلى مواكبة التقدم الذي حققه نموذج "جيمناي 3" التابع لشركة "غوغل".

كشفت شركة الذكاء الاصطناعي "أوبن إيه آي" أخيراً عن نموذج GPT-5.2، وهو أحدث إصدار ضمن سلسلة نماذجها المستخدمة لتشغيل روبوت الدردشة "شات جي بي تي".

وتشير تقارير إلى أن هذا الإطلاق جاء في ظل حديث عن تراجع ملحوظ في الحصة السوقية للشركة، مع انتقال عدد من المستخدمين إلى نموذج "جيماني 3" من "غوغل"، إضافة إلى روبوتات دردشة أخرى تعتمد على الذكاء الاصطناعي.

تغير موقع "أوبن إيه آي" في وول ستريت

تنحصر المنافسة الرئيسية حالياً بين "جيماني 3" وGPT-5.2، إلا أن نموذج "غروك 4.1" الذي طورته شركة xAI التابعة لإيلون ماسك لا يزال حاضراً بقوة، بعد تحقيقه نتائج جيدة في عدد من مؤشرات الأداء، وفق تقارير تقنية متخصصة.

وفي ما يأتي مقارنة بين "غروك 4.1" وGPT-5.2 استناداً إلى مجموعة من معايير تقييم أداء نماذج الذكاء الاصطناعي:

تصنيفات منصة LMArena

لا يظهر نموذج GPT-5.2 في معظم تصنيفات منصة LMArena، ما يجعل المقارنة المباشرة بينه وبين "غروك" محدودة. ومع ذلك، تشير "أوبن إيه آي" إلى أن GPT-5.2 يتفوق بنسبة طفيفة على GPT-5.1 في غالب المقاييس، علماً أن الأخير مُدرج ضمن تصنيفات المنصة.

وتُعد LMArena منصة إلكترونية متخصصة في تقييم النماذج اللغوية الكبيرة عبر اختبارات معيارية متنوعة.

وبافتراض أن GPT-5.2 سيحل محل GPT-5.1 في جميع الفئات، فمن المتوقع أن يتصدر لوحات الترتيب أو يقترب منها بشكل كبير. وفي الفئة الوحيدة التي يظهر فيها حالياً، وهي تطوير الويب، يحتل المرتبة الثانية عالمياً متقدماً على "غروك".

وبناءً على ذلك، يُرجَّح أن يتفوق GPT-5.2 على "غروك" في معظم الفئات، مع احتمال احتفاظ "غروك" بالمركز الثاني في تصنيف النصوص مباشرة بعد "جيماني 3".

اختبارات الأداء

نظراً الى حداثة إصدار GPT-5.2، لم يخضع بعد لعدد كبير من اختبارات الأداء المستقلة، لذلك تعتمد المقارنات الحالية على نتائج الاختبارات التي نشرتها "أوبن إيه آي" في بيان صحافي من دون تحقق مستقل.

في اختبار Creative Writing v3، سجل GPT 1675.5 نقطة في مقابل 1268.6 نقطة لـ"غروك 4.1".

كما تفوق في اختبار GDPval-AA بنتيجة 1474 نقطة في مقابل 1041 نقطة لـ"غروك".

وفي اختبار GPQA Diamond، حقق GPT-5.2 نسبة 90.3% في مقابل 87.7% لـ"غروك".

أما في اختبار AIME 2025، فقد سجل GPT-5.1 نسبة 95.7% قي مقابل 92.7% لـ"غروك"، بينما حقق GPT-5.2 تفوقاً إضافياً بدقة أعلى بكثير في اختبار FrontierMath.

وتشير بقية الاختبارات إلى الاتجاه نفسه تقريباً، إذ يتفوق GPT-5.2 على "غروك 4.1" في معظم المقاييس، مع فوارق غالباً ليست بسيطة. ومع ذلك، قد تختلف النتائج في الاستخدام الفعلي، لأن الاختبارات المعيارية تعكس جانباً محدوداً من الأداء الحقيقي.

التوافر والتسعير

يتوافر كل من GPT-5.2 و"غروك 4.1" للجمهور، بحيث يمكن الوصول إلى الأول عبر "شات جي بي تي"، بينما يتوافر الآخر عبر منصة Grok Chat.

ومن حيث الميزات، يوفر كلاهما وظائف روبوتات الدردشة المدعومة بالذكاء الاصطناعي، إضافة إلى إمكان إنشاء الصور مباشرة. كما يتيح "شات جي بي تي" إنشاء مقاطع فيديو باستخدام Sora 2، في حين يعتمد "غروك" على منصة Grok Imagine. ومع ذلك، لا يزال كلا النظامين متأخرين مقارنة بمنافسين مثل Veo 3 من "غوغل" و Ray3 من LumaAI.

وعلى مستوى التوافر، يتمتع النموذجان بدرجة تقارب كبيرة، إلا أن "شات جي بي تي" مدمج في عدد أكبر من المنتجات، ما يمنحه أفضلية من حيث الانتشار.

للوصول إلى GPT-5.2، يتطلب الأمر الاشتراك في باقة Pro من "شات جي بي تي" التي تبدأ من 20 دولاراً شهرياً أو 200 دولار شهرياً حسب الاستخدام. أما النسخة المجانية من "غروك" فتقتصر على "غروك 4" فقط، ولا تشمل "غروك 4.1"، ما يستوجب الاشتراك للوصول إليه. وتبدأ اشتراكات SuperGrok من 30 دولاراً شهرياً وقد تصل إلى 300 دولار شهرياً.

وبذلك، يتمتع GPT-5.2 بأفضلية سعرية واضحة، إذ إن 20 دولاراً أقل من 30 دولاراَ.

أما تحديد النموذج الأفضل، فيبقى مرهوناً بتجربة المستخدم نفسه، إذ تختلف طبيعة الاستخدام من شخص الى آخر، ولا تعكس الأرقام أو الاشتراكات بالضرورة الأداء العملي في كل حالة.