انثروبيك تتفوق على أوبن إيه آي وغوغل.. ما المميز في نموذجها؟

أطلقت شركة أنثروبيك نسخة محسّنة من نموذج الذكاء الاصطناعي الرئيسي لديها، محققة قفزة نوعية في أداء مهام هندسة البرمجيات، في وقت تتسابق فيه الشركة الناشئة للحفاظ على صدارتها في سوق البرمجة المدعومة بالذكاء الاصطناعي، قبل دخول المنافس المرتقب من شركة أوبن إيه آي.

النموذج الجديد يحمل اسم كلود أوبوس 4.1، ويتميز بتحسينات لافتة في المهام الوكيلة والبرمجة الواقعية والاستدلال، بحسب إعلان أنثروبيك.

وحقق كلود أوبوس 4.1 نتيجة 74.5 بالمئة في اختبار SWE-bench Verified، الذي يُستخدم لقياس قدرة نماذج الذكاء الاصطناعي على حل مشكلات برمجية واقعية، متفوقًا على نموذج O3 من أوبن إيه آي الذي سجل 69.1 بالمئة، ونموذج جيميني 2.5 برو من غوغل الذي نال 67.2 بالمئة.

هذه النتائج تعزز موقع أنثروبيك في طليعة الشركات التي تقدم مساعدات ذكية في مجال البرمجة، خاصة بعد أن رفعت دقة هندسة البرمجيات في نموذجها الجديد مقارنة بكلود سونِت 3.7 الذي سجل 62.3 بالمئة، وكلود أوبوس 4 الذي بلغ 72.5 بالمئة.

النموذج المحدّث يتمتع بقدرات أعلى في البحث المعمّق وتحليل البيانات، خاصة فيما يتعلق بتتبع التفاصيل والبحث الوكيل، وفق ما أعلنته الشركة.

ويأتي هذا التحديث في سياق استعداد أنثروبيك للمنافسة الشرسة المتوقعة مع إطلاق نموذج جي بي تي 5 من أوبن إيه آي، الذي من المرجح أن يعيد رسم خريطة التفوق في هذا القطاع، ما دفع البعض لاعتبار توقيت طرح كلود أوبوس 4.1 انعكاسًا لحالة من الاستعجال الاستباقي أكثر منه ثمرة استعداد شامل.

النموذج الجديد أصبح متاحًا للعملاء اعتبارًا من يوم الثلاثاء، سواء من خلال منصة كلود كود، أو عبر واجهة برمجة التطبيقات الخاصة بأنثروبيك، بالإضافة إلى منصتي أمازون بيدروك وفيرتكس AI التابعة لغوغل.