أعلنت شركة أنثروبيك عن إطلاق مجموعة من التحسينات الكبيرة على نماذج الذكاء الاصطناعي الخاصة بها، بما في ذلك نماذج Claude 3.5 Haiku المُحسّنة، التي تتضمن ميزة جديدة تتيح لهذه النماذج التفاعل المباشر مع واجهات الحواسيب.
وحقق نموذج Claude 3.5 Sonnet تحسينات ملحوظة في الأداء خلال المهام البرمجية، حيث تدعي الشركة أن أداءه يتفوق على جميع النماذج المتاحة حالياً، بما في ذلك الأنظمة المتخصصة في البرمجة.
وتعتبر القدرة الرئيسية التي تم الإعلان عنها هي تمكن نموذج Claude 3.5 من التفاعل مع واجهات الحواسيب. عوضاً عن تطوير أدوات محددة لكل مهمة، اتبعت الشركة نهجًا شاملاً من خلال تعليم النموذج مهارات عامة لاستخدام الحواسيب، مما يمكنه من تحريك المؤشر، والنقر على العناصر، وإدخال البيانات باستخدام لوحة مفاتيح افتراضية.
وفي اختبار OSWorld، المخصص لتقييم قدرة نماذج الذكاء الاصطناعي على استخدام الحواسيب بشكل مشابه للبشر، حقق نموذج Sonnet 3.5 نتيجة مذهلة تتجاوز أداء الأنظمة الأخرى بفارق كبير.
ومع ذلك، تعي شركة أنثروبيك أن قدرة Claude على التفاعل مع الحواسيب لا تزال غير مثالية، حيث تواجه النموذج بعض التحديات في المهام البسيطة مثل التمرير والسحب والتكبير. لذا، توصي الشركة المطورين ببدء الاعتماد على هذه الميزة في المهام المنخفضة المخاطر.
وقد أظهرت النماذج الجديدة تحسينات في مجالات التفكير المنطقي، وحل المشكلات الرياضية، والمهام البرمجية. وعلى الرغم من أن نموذج Sonnet 3.5 الجديد أحرز تقدمًا طفيفًا في اختبار MMLU لقياس فهم اللغة مقارنةً بالإصدار السابق، إلا أن الأداء العام كان أفضل مما سبق.
كما قدمت الشركة أيضًا النموذج الجديد Claude 3.5 Haiku، الذي يظهر تفوقاً واضحاً على النموذج السابق Claude 3 Opus في العديد من المعايير، مع المحافظة على السرعة والتكلفة مثل النموذج السابق. ومع ذلك، لم تعلن الشركة عن أي خطط لإطلاق نسخة جديدة من نموذج Opus في القريب.
ومن المتوقع أن يتم إطلاق نموذج Haiku الجديد في وقت لاحق من هذا الشهر، حيث تعد الشركة بإحداث تغيير في المنافسة في مجال أنظمة الذكاء الاصطناعي القادرة على التفاعل مع الحواسيب.