Decryptعمومی۹ تیر ۱۴۰۵👁 0 بازدید

مدل قراردادی کلود سانت ۵ آنتروپیک در آستانه رقابت با اوپوس ۴.۸ با قیمتی کمتر

آنتروپیک مدل سانت ۵ را با قیمتی کمتر عرضه کرد، برتری نزدیک به اوپوس ۴.۸ در ارزیابی‌ها و عملکردهای مختلف، با تغییرات در توکنایزر و کاهش هزینه نسبت به مدل قبلی. مدل جدید در مقایسه با نسل‌های قبلی نشان‌دهنده رقابت شدید در بازار هوش مصنوعی است، هرچند فاصله زمانی میان نسخه‌ها کاهش یافته است.

آنتروپیک مدل جدید میان‌رده خود، کلود سانت ۵، را روز سه‌شنبه عرضه کرد با قیمت ۲ دلار برای میلیون توکن ورودی و ۱۰ دلار برای میلیون توکن خروجی تا ۳۱ آگوست، پس از آن قیمت به ۳ دلار و ۱۵ دلار بازمی‌گردد—که هنوز بسیار کمتر از نرخ ۵ دلاری/۲۵ دلاری اوپوس ۴.۸ است. بر اساس ارزیابی‌های خود آنتروپیک، سانت ۵ تقریباً هم‌قدرات اوپوس ۴.۸ در معیار benchmark بررسی شده است. سانت ۵ بدون محدودیت خاصی عرضه می‌شود، در حالی که فابول ۵ و میثوس ۵ به دلیل دستورالعمل‌های کنترل صادرات ۱۲ ژوئن، برای استفاده عمومی تعلیق شده‌اند.

این مدل که «قوی‌ترین مدل سانت تاکنون» نامیده شده، به عنوان مدل پیشفرض برای کاربران رایگان و پرو، در برنامه‌های مکس، تیم و ادارۀ ارائه می‌شود و از طریق کد کلود و API در دسترس است. بر خلاف نسخه‌های قبلی سانت، این مدل با مدل قبلی اوپوس در کنار هم قرار گرفته است و قرار نیست در سطح پایین‌تری باشد.

در پست راه‌اندازی، شرکت اظهار داشت که عملکرد سانت ۵ «نزدیک به اوپوس ۴.۸ است، اما با قیمت پایین‌تر». توسعه‌دهندگان می‌توانند بین دو مدل سوییچ کنند یا در برنامه وب سطح دقت را با هزینه متفاوت تنظیم نمایند، که این امکان تلفیق قابلیت‌ها را در مدل‌هایی که قبلاً نیازمند نرخ‌های اوپوس بودند، فراهم می‌کند.

در بنچمارک SWE-bench Pro، که مشکلاتی از مخازن در حال نگهداری را با تغییرات فایل‌های چندگانه حل می‌کند، سانت ۵ به درصد حل ۶۳.۲٪ رسید، در مقابل ۵۸.۱٪ سانت ۴.۶.

در معیار GDPval-AA v2، که وظایف حرفه‌ای دنیای واقعی در ۴۴ شغل را با ارزیابی‌های تصادفی Elo می‌سنجد، امتیاز ۱۶۱۸ را کسب کرد، که رقابتی مستقیم با ۱۶۱۶ اوپوس ۴.۸ است. تفاوت میان سانت ۵ و اوپوس ۴.۸ در آزمون «اختران انسانیت» عملاً ناچیز است: ۵۷.۴٪ در مقابل ۵۷.۹٪.

سانت ۵ همچنین با توکنایزر به‌روزرسانی‌شده عرضه شده است، سیستمی که متن را به واحدهای قابل پردازش تقسیم می‌کند، و بر اساس محتوا، توکن‌های بیشتری را مصرف می‌کند. «سانت ۵ به‌روزرسانی شده نسبت به سانت ۴.۶ است، اما از توکنایزر جدیدی استفاده می‌کند که فرآیند متن را تغییر می‌دهد تا عملکرد را بهبود بخشد» گفتند. «این تغییر منجر می‌شود که همان ورودی، توکن‌های بیشتری مصرف کند، حدود ۱.۰ تا ۱.۳۵ برابر، بسته به نوع محتوا.»

شرکت آنتروپیک قیمت اولیه ۲ دلار/۱۰ دلار را برای این تغییر تنظیم کرد تا تا ۳۱ آگوست، هزینه‌های این تحول تقریباً برابر باشد، و پس از آن قیمت به حالت عادی بازمی‌گردد.

در حالی که برخی توسعه‌دهندگان در بهار امسال درباره کاهش تدریجی قابلیت‌های اوپوس ۴.۶ پس از عرضه آرام آن صحبت می‌کردند و به آن «کاهش‌پذیری هوش مصنوعی» می‌گفتند، آنتروپیک هرگونه قصد کاهش عمدی مدل‌ها را رد کرد. برخی گمانه‌زنی‌ها معتقد بودند pattern تکراری است: مدل قدیمی را رها کنید و مدل جدید به نظر بزرگ‌تر و پیشرفته‌تر بیاید.

سانت ۵ بدون اضافه کردن بارهای خاص، در حالی که فابول ۵ و میثوس ۵ به دلیل محدودیت‌های صادرات آمریکا در ۱۲ ژوئن، برای افراد خارجی تعلیق شده‌اند، عرضه می‌شود. سانت ۵ هرگز بر روی وظایف امنیت سایبری آموزش نداده است و جایزه‌ای در توسعه اکسپلویت فایرفاکس نداشته است، بنابراین دارای امنیت‌های کمتری نسبت به فابول است.

مدل آنتروپیک طوری طراحی شده است که تقریباً به هوش مصنوعی اوپوس در زمینه‌های رمزنگاری، عامل‌ها و کارهای روزمره نزدیک باشد. جالب است که این مدل اولین است که قدرت نقد دستور «ماده‌ی قانون اساسی» خود را دارد، حتی وقتی آن را غی‌اخلاقی می‌داند. تیم تحقیق می‌گوید هنوز مشخص نیست این چه معنایی برای مدل دارد، اما ارزش توجه دارد.

در آزمایش‌های اولیه، نمونه‌ای از این مدل برای ساخت یک بازی کوچک در مرورگر آزموده شد، همان آزمایشی که سال گذشته بر روی سانت ۴.۵ انجام داده بودیم.

نتایج نشان داد که بازی اولیه با همان ورودی سریع اجرا شد، با تصاویر منطقی‌تر و منطق دقیق‌تر نسبت به سانت ۴.۶. اما زمان‌برتر بود، حدود ۳۰ دقیقه reasoning مصرف کرد و توکن‌ها را به شدت مصرف کرد، به‌طوری که ۹۰٪ از محدودیت ۵ تایی ما در برنامه Claude Pro مصرف شد.

تست نهایی این بازی را می‌توانید در سایت itch.io ما مشاهده کنید.

در یک وظیفه سخت‌تر چندمرحله‌ای، سانت ۵ نزدیک به اوپوس ۴.۸ قرار گرفت و همان پرس و جو در حالت چندشات، هزینه کمتری نسبت به اوپوس یا فابول داشت.

نسخه شماره‌گذاری سانت ۵ نشان می‌دهد که هر جهش عددی در تاریخچه کلود، نشان‌دهنده یک نسل نو است، مثل نسخه ۱ در مارس ۲۰۲۳، نسخه ۲ چهار ماه بعد، نسخه ۳ هشت ماه بعد، و نسخه ۴ در ۱۴ ماه بعد در مه ۲۰۲۵. سانت ۵ در ۱۳ ماه بعد از آن عرضه شد، نشان‌دهنده رقابت سنگین در بازار است، مخصوصاً اکنون که مدل‌های چینی نیز فاصله را به سرعت کم می‌کنند.

با این حال، این جهش نسلی چقدر اوج‌گیر است نسبت به جهش از کلود ۳ به کلود ۴، شاید این‌طور نباشد. این نشان می‌دهد که شرکت‌های هوش مصنوعی در حال سریع‌ترین فرآیند عرضه هستند، حتی اگر پیشرفت‌ها قابل ملاحظه نباشد.

اگر آنتروپیک طبق روال قبلی عمل کند، سانت غالباً مدل اول است، سپس مدل‌های کم‌هزینه و کوچک «هایجو» را همراه با اوپوس، نسخه پیشرفته، در زمان‌های بعدی عرضه می‌کند. فاصله بین این مدل‌ها معمولاً یک ماه است؛ یعنی سانت ۴.۵ در سپتامبر ۲۰۲۵، هایجو ۴.۵ در اکتبر و اوپوس ۴.۵ در نوامبر.

با این روند، پیش‌بینی می‌شود که هایجو ۵ و اوپوس ۵ نیز امسال عرضه شوند، هرچند آنتروپیک در زمان‌بندی انتشار مدل‌ها بی‌ثبات است و فاصله بین هایجو ۴.۵ و سانت ۴.۶ بیش از سه ماه بود، پس باید امیدوار بود تا اوپوس ۵ هم زودتر ظاهر شود.

برچسب‌ها:هوش مصنوعیمدل زبانیآنتروپیککلود سانت ۵اوپوس ۴.۸تولید محتوا

منبع اصلی:

https://decrypt.co/372458/anthropic-claude-sonnet-5-close-opus-4-8

مدل قراردادی کلود سانت ۵ آنتروپیک در آستانه رقابت با اوپوس ۴.۸ با قیمتی کمتر

📰 مطالب مرتبط