هوش مصنوعی قدرتمند جدید علی‌بابا یک تریلیون پارامتر دارد!

رضا کریمی

11 ماه پیش

هوش مصنوعی قدرتمند جدید علی‌بابا یک تریلیون پارامتر دارد!

شرکت بزرگ تجارت الکترونیک چین، علی‌بابا، بار دیگر توجه جامعه‌ی فناوری را به خود جلب کرد. تیم تحقیقاتی هوش مصنوعی این شرکت با نام Qwen پس از عرضه مجموعه‌ای از مدل‌های متن‌باز قدرتمند در تابستان گذشته، اکنون از بزرگ‌ترین مدل زبانی خود با نام Qwen3-Max-Preview (Instruct) رونمایی کرد؛ مدلی با بیش از یک تریلیون پارامتر که در حد و اندازه‌ی غول‌های آمریکایی مثل گوگل، OpenAI و آنتروپیک ظاهر می‌شود.

به‌نوشته‌ی VentureBeat، پارامترها همان گزینه‌ها داخلی هستند که رفتار مدل‌های زبانی را هدایت می‌کنند؛ هرچه تعدادشان بیشتر باشد، قدرت پردازش و کیفیت لاگ‌آوتی مدل هوش مصنوعی نیز بالاتر می‌رود. درحالی که بسیاری از آزمایشگاه‌های هوش مصنوعی به سمت مدل‌های کوچک‌تر حرکت کرده‌اند، تصمیم Qwen برای انتشار مدل فوق‌العاده بزرگ توجهات زیادی را جلب کرده است.

براساس داده‌های بنچمارک منتشرشده، Qwen3-Max-Preview نه‌تنها از بهترین مدل قبلی این شرکت پیشی گرفته است، بلکه موفق شد در آزمایش‌هایی مثل SuperGPQA ،AIME25 ،Arena-Hard v2 و LiveBench رقبای مطرحی مثل Claude Opus 4 و Deepseek-V3.1 را هم پشت سر بگذارد.

مدل Qwen3-Max درحال حاضر با وب‌سایت Qwen Chat، رابط ابری Alibaba Cloud رابط برنامه‌نویسی و نیز OpenRouter قابل استفاده است و به‌طور پیش‌فرض در ابزار متن‌باز AnyCoder نیز فعال دردسترس قرار دارد. بااین حال، برخلاف ورژن‌های پیشین Qwen، این مدل فعلاً به‌صورت متن‌باز منتشر نشده است و توسعه‌دهندگان فقط با رابط برنامه‌نویسی پولی یا سکوی نرم‌افزاری‌های توزیع معرفی‌شده می‌توانند به آن اجازه دسترسی داشته باشند.

ویژگی‌های فنی Qwen3-Max قابل‌توجه است: لاگینی متنی ۲۶۲ هزار توکن، کمک از Context Caching برای افزایش شتاب، توانایی انجام استدلال پیچیده، تولید محتوا، پردازش داده‌های ساختاریافته مثل JSON و حتی کد برنامهنویسی. این مدل در آزمایش‌های اولیه نه‌تنها سریع‌تر از ChatGPT پاسخ می‌دهد، بلکه بسیاری از اشتباههای رایج مدل‌های زبانی را نیز مرتکب نمی‌شود.

بیشتر بخوانید: ادامه کشمکش‌ها برای حکمرانی هوش مصنوعی؛ اعضای شورای ملی راهبری مشخص شدند

علی‌بابا برای استفاده از Qwen3-Max ساختار قیمت‌گذاری پلکانی در نظر گرفته است؛ هزینه‌ها بسته به حجم لاگینی بین ۰٫۸۶۱ تا ۲٫۱۵۱ دلار به‌ازای هر یک میلیون توکن و لاگ‌آوتی بین ۳٫۴۴۱ تا ۸٫۶۰۲ دلار متغیر است. این ساختار باعث می‌شود استفاده در مقیاس کوچک مقرون‌به‌صرفه‌تر باشد و در حجم‌های بزرگ هزینه‌ها متناسب افزایش یابد.

معرفی Qwen3-Max بازتاب گسترده‌ای در شبکه‌های اجتماعی داشته است. اعضای تیم Qwen تأکید کرده‌اند که این مدل فعلاً آزمایشی ارائه می‌شود و ورژن‌ی نهایی با قدرتی بیشتر از راه خواهد رسید. برخی یوزران نیز در آزمایش‌های خود ریپورت داده‌اند که مدل موردبحث توانسته است به سؤالات پیچیده‌ی منطقی پاسخ‌های مرحله‌به‌مرحله و دقیق بدهد؛ حتی در مسائلی که برخی مدل‌های پیشرفته مثل جمنای ۲٫۵ پرو و GPT-5 Thinking دچار مشکل بودند.

برای کسب‌وکارها، Qwen3-Max-Preview می‌تواند مزایای بزرگی با داشته باشد؛ از کاهش نیاز به فاین‌تیونینگ مداوم گرفته تا افزایش عملکرد در پردازش داده‌های حجیم و اجرای وظایف چندمرحله‌ای. البته، ساختار هزینه، وضعیت آزمایشی و نگرانی‌های ایمنیی استفاده از رابط برنامه‌نویسی ابری از جمله چالش‌هایی است که شرکت‌ها باید پیش از تصمیم‌گیری در نظر بگیرند.

در مجموع، انتشار مدل Qwen3-Max-Preview نشان‌دهنده‌ی سرمایه‌گذاری جدی علی‌بابا در مقیاس‌پذیری سیستم‌های هوش مصنوعی است. اگر ورژن‌ی نهایی با همین روند منتشر شود، این مدل می‌تواند یکی از رقبای اصلی غول‌های آمریکایی در رقابت مدل‌های زبانی فوق‌العاده بزرگ باشد.

برچسب‌ها: ChatGPT, برنامه‌نویسی, شبکه‌های اجتماعی, گوگل