آنتروپیک مدل جدید میانرده خود، کلود سانت ۵، را روز سهشنبه عرضه کرد با قیمت ۲ دلار برای میلیون توکن ورودی و ۱۰ دلار برای میلیون توکن خروجی تا ۳۱ آگوست، پس از آن قیمت به ۳ دلار و ۱۵ دلار بازمیگردد—که هنوز بسیار کمتر از نرخ ۵ دلاری/۲۵ دلاری اوپوس ۴.۸ است. بر اساس ارزیابیهای خود آنتروپیک، سانت ۵ تقریباً همقدرات اوپوس ۴.۸ در معیار benchmark بررسی شده است. سانت ۵ بدون محدودیت خاصی عرضه میشود، در حالی که فابول ۵ و میثوس ۵ به دلیل دستورالعملهای کنترل صادرات ۱۲ ژوئن، برای استفاده عمومی تعلیق شدهاند.
این مدل که «قویترین مدل سانت تاکنون» نامیده شده، به عنوان مدل پیشفرض برای کاربران رایگان و پرو، در برنامههای مکس، تیم و ادارۀ ارائه میشود و از طریق کد کلود و API در دسترس است. بر خلاف نسخههای قبلی سانت، این مدل با مدل قبلی اوپوس در کنار هم قرار گرفته است و قرار نیست در سطح پایینتری باشد.
در پست راهاندازی، شرکت اظهار داشت که عملکرد سانت ۵ «نزدیک به اوپوس ۴.۸ است، اما با قیمت پایینتر». توسعهدهندگان میتوانند بین دو مدل سوییچ کنند یا در برنامه وب سطح دقت را با هزینه متفاوت تنظیم نمایند، که این امکان تلفیق قابلیتها را در مدلهایی که قبلاً نیازمند نرخهای اوپوس بودند، فراهم میکند.
در بنچمارک SWE-bench Pro، که مشکلاتی از مخازن در حال نگهداری را با تغییرات فایلهای چندگانه حل میکند، سانت ۵ به درصد حل ۶۳.۲٪ رسید، در مقابل ۵۸.۱٪ سانت ۴.۶.
در معیار GDPval-AA v2، که وظایف حرفهای دنیای واقعی در ۴۴ شغل را با ارزیابیهای تصادفی Elo میسنجد، امتیاز ۱۶۱۸ را کسب کرد، که رقابتی مستقیم با ۱۶۱۶ اوپوس ۴.۸ است. تفاوت میان سانت ۵ و اوپوس ۴.۸ در آزمون «اختران انسانیت» عملاً ناچیز است: ۵۷.۴٪ در مقابل ۵۷.۹٪.
سانت ۵ همچنین با توکنایزر بهروزرسانیشده عرضه شده است، سیستمی که متن را به واحدهای قابل پردازش تقسیم میکند، و بر اساس محتوا، توکنهای بیشتری را مصرف میکند. «سانت ۵ بهروزرسانی شده نسبت به سانت ۴.۶ است، اما از توکنایزر جدیدی استفاده میکند که فرآیند متن را تغییر میدهد تا عملکرد را بهبود بخشد» گفتند. «این تغییر منجر میشود که همان ورودی، توکنهای بیشتری مصرف کند، حدود ۱.۰ تا ۱.۳۵ برابر، بسته به نوع محتوا.»
شرکت آنتروپیک قیمت اولیه ۲ دلار/۱۰ دلار را برای این تغییر تنظیم کرد تا تا ۳۱ آگوست، هزینههای این تحول تقریباً برابر باشد، و پس از آن قیمت به حالت عادی بازمیگردد.
در حالی که برخی توسعهدهندگان در بهار امسال درباره کاهش تدریجی قابلیتهای اوپوس ۴.۶ پس از عرضه آرام آن صحبت میکردند و به آن «کاهشپذیری هوش مصنوعی» میگفتند، آنتروپیک هرگونه قصد کاهش عمدی مدلها را رد کرد. برخی گمانهزنیها معتقد بودند pattern تکراری است: مدل قدیمی را رها کنید و مدل جدید به نظر بزرگتر و پیشرفتهتر بیاید.
سانت ۵ بدون اضافه کردن بارهای خاص، در حالی که فابول ۵ و میثوس ۵ به دلیل محدودیتهای صادرات آمریکا در ۱۲ ژوئن، برای افراد خارجی تعلیق شدهاند، عرضه میشود. سانت ۵ هرگز بر روی وظایف امنیت سایبری آموزش نداده است و جایزهای در توسعه اکسپلویت فایرفاکس نداشته است، بنابراین دارای امنیتهای کمتری نسبت به فابول است.
مدل آنتروپیک طوری طراحی شده است که تقریباً به هوش مصنوعی اوپوس در زمینههای رمزنگاری، عاملها و کارهای روزمره نزدیک باشد. جالب است که این مدل اولین است که قدرت نقد دستور «مادهی قانون اساسی» خود را دارد، حتی وقتی آن را غیاخلاقی میداند. تیم تحقیق میگوید هنوز مشخص نیست این چه معنایی برای مدل دارد، اما ارزش توجه دارد.
در آزمایشهای اولیه، نمونهای از این مدل برای ساخت یک بازی کوچک در مرورگر آزموده شد، همان آزمایشی که سال گذشته بر روی سانت ۴.۵ انجام داده بودیم.
نتایج نشان داد که بازی اولیه با همان ورودی سریع اجرا شد، با تصاویر منطقیتر و منطق دقیقتر نسبت به سانت ۴.۶. اما زمانبرتر بود، حدود ۳۰ دقیقه reasoning مصرف کرد و توکنها را به شدت مصرف کرد، بهطوری که ۹۰٪ از محدودیت ۵ تایی ما در برنامه Claude Pro مصرف شد.
تست نهایی این بازی را میتوانید در سایت itch.io ما مشاهده کنید.
در یک وظیفه سختتر چندمرحلهای، سانت ۵ نزدیک به اوپوس ۴.۸ قرار گرفت و همان پرس و جو در حالت چندشات، هزینه کمتری نسبت به اوپوس یا فابول داشت.
نسخه شمارهگذاری سانت ۵ نشان میدهد که هر جهش عددی در تاریخچه کلود، نشاندهنده یک نسل نو است، مثل نسخه ۱ در مارس ۲۰۲۳، نسخه ۲ چهار ماه بعد، نسخه ۳ هشت ماه بعد، و نسخه ۴ در ۱۴ ماه بعد در مه ۲۰۲۵. سانت ۵ در ۱۳ ماه بعد از آن عرضه شد، نشاندهنده رقابت سنگین در بازار است، مخصوصاً اکنون که مدلهای چینی نیز فاصله را به سرعت کم میکنند.
با این حال، این جهش نسلی چقدر اوجگیر است نسبت به جهش از کلود ۳ به کلود ۴، شاید اینطور نباشد. این نشان میدهد که شرکتهای هوش مصنوعی در حال سریعترین فرآیند عرضه هستند، حتی اگر پیشرفتها قابل ملاحظه نباشد.
اگر آنتروپیک طبق روال قبلی عمل کند، سانت غالباً مدل اول است، سپس مدلهای کمهزینه و کوچک «هایجو» را همراه با اوپوس، نسخه پیشرفته، در زمانهای بعدی عرضه میکند. فاصله بین این مدلها معمولاً یک ماه است؛ یعنی سانت ۴.۵ در سپتامبر ۲۰۲۵، هایجو ۴.۵ در اکتبر و اوپوس ۴.۵ در نوامبر.
با این روند، پیشبینی میشود که هایجو ۵ و اوپوس ۵ نیز امسال عرضه شوند، هرچند آنتروپیک در زمانبندی انتشار مدلها بیثبات است و فاصله بین هایجو ۴.۵ و سانت ۴.۶ بیش از سه ماه بود، پس باید امیدوار بود تا اوپوس ۵ هم زودتر ظاهر شود.




