آنتروپیک بهتازگی از جدیدترین مدل هوش مصنوعی خود، Claude Sonnet 4.5، رونمایی کرد و وارد مرحله جدیدی از رقابت برای ساخت بهترین ایجنتهای هوش مصنوعی و دستیاران کد برنامهنویسی شد. این مدل در آزمایشها موفق شد به صورت کاملاً مستقل و بهمدت ۳۰ ساعت متوالی یک اپلیکیشن چت پیچیده شبیه به Slack را از ابتدا کد برنامهنویسی کند.
به گفته آنتروپیک، بزرگترین دستاورد Claude Sonnet 4.5 توانایی آن در عملکرد مستقل و طولانیمدت است. این مدل در یک آزمایش، وظیفه ساخت یک اپلیکیشن چت را برعهده گرفت و پس از ۳۰ ساعت کار مداوم و تولید حدود ۱۱ هزار خط کد برنامه، زمانی متوقف شد که وظیفه خود را بهطور کامل به پایان رسانده بود. این یک جهش بزرگ نسبت به رکورد ۷ ساعته مدل قبلی این شرکت است و نشان میدهد که ایجنتهای هوش مصنوعی دیگر فقط ابزارهای ساده نیستند که باید دائماً بالای سر آنها باشید و حالا به همکار واقعی شما تبدیل شدهاند.
آنتروپیک این مدل را «بهترین مدل جهان برای ایجنتهای دنیای واقعی، کد برنامهنویسی و استفاده از کامپیوتر» نامیده است.
مدل هوش مصنوعی Claude Sonnet 4.5 آنتروپیک
به گفته مدیران محصول Anthropic، این مدل جدید در سطح یک «رئیس دفتر» عمل میکند. مثلاً، میتواند تقویم چندین نفر را بررسی کردن و یک جلسه را برنامهریزی کند یا براساس ریپورتهای جلسات خلاصههایی برای مدیران بنویسد.
این مدل در حوزههای تخصصی مانند ایمنی سایبری، خدمات مالی و تحقیقات نیز پیشرفتهای چشمگیری داشته و به گفته یکی از مشتریان اولیه (شرکت Canva) در انجام کارهای پیچیده و طولانی عملکرد فوقالعادهای از خود نشان داده است.

Anthropic همزمان با Sonnet 4.5، مجموعهای از ابزارهای جدید را برای توسعهدهندگان عرضه کرده تا آنها بتوانند ایجنتهای هوشمند خود را بسازند. این مجموعه که Claude Agent SDK نام دارد، شامل اجازه دسترسی به ماشینهای مجازی، کنترل حافظه و کمک از چند ایجنت است. درواقع، آنتروپیک همان بلوکهای ساختاری را که برای ساخت کالاها پیشرفته خود استفاده میکند، در اختیار جامعه توسعهدهندگان قرار داده است.
عرضه Claude Sonnet 4.5 تنها چند روز پس از رونمایی OpenAI از قابلیت Pulse برای ChatGPT صورت میگیرد و نشان میدهد که میدان اصلی نبرد، اکنون بر سر ساخت ایجنتهای هوش مصنوعی است؛ دستیاران هوشمندی که میتوانند به جای یوزر کارهای مختلف انجام دهند. آنتروپیک با تمرکز ویژه بر روی کد برنامهنویسی و استفاده از کامپیوتر، قصد دارد در این حوزه از رقبا سبقت بگیرد.