Runway اولین «مدل جهانی» خود را معرفی کرد؛ نسل جدید شبیه‌سازی با درک واقعی فیزیک جهان [تماشا کنید]

بدون دیدگاه
Runway اولین «مدل جهانی» خود را معرفی کرد؛ نسل جدید شبیه‌سازی با درک واقعی فیزیک جهان [تماشا کنید]

شرکت هوش مصنوعی Runway اولین «مدل جهانی» یا World Model خود را معرفی کرده و هم‌زمان جدیدترین مدل ویدیویی‌ خود را به قابلیت صوتی مجهز کرده است. اصطلاح «World Model» به نوعی سیستم هوش مصنوعی گفته می‌شود که با یادگیری یک شبیه‌سازی درونی از سازوکار‌های جهان، می‌تواند بدون نیاز به آموزش جداگانه، به توانایی‌هایی مانند استدلال و برنامه‌ریزی دست پیدا کند.

با تشدید رقابت در حوزه مدل‌های جهان‌محور، حالا Runway هم به جمع استارتاپ‌ها و غول‌های فناوری پیوسته که در تلاش برای توسعه این نسل جدید از مدل‌ها هستند. سازوکار مدل جدید این شرکت که GWM-1 نام دارد، به‌صورت پیش‌بینی فریم‌به‌فریم است و به گفته Runway، می‌تواند شبیه‌سازی‌هایی با درک درست از فیزیک و رفتار دنیای واقعی در گذر زمان بسازد.

Runway که همین ماه مدل ویدیویی Gen 4.5 خود را منتشر کرده بود، می‌گوید GWM-1 از نظر عمومی از مدل Genie-3 گوگل و سایر رقبا یک گام جلوتر است. این شرکت مدل تازه خود را ابزاری برای ساخت شبیه‌سازی‌های آموزشی در حوزه‌هایی مانند رباتیک و علوم زیستی معرفی می‌کند.

ساخت شبیه‌سازی‌های خیره‌کننده با هوش مصنوعی Runway

در شبکه اجتماعی ایکس، حساب رسمی Runway با انتشار ویدیو زیر نوشته است:

«یک صحنه ثابت به مدل می‌دهید و آن بلافاصله فضایی غوطه‌ورکننده، بی‌انتها و قابل کاوش تولید می‌کند؛ فضایی که هنگام حرکت در آن، هندسه، نورپردازی و فیزیک به‌صورت لحظه‌ای شکل می‌گیرد. همه چیز در لحظه و به‌صورت زنده ساخته می‌شود. می‌توانید به هر مکانی سفر کنید. می‌توانید هر عاملی باشید: یک انسان درحال قدم‌زدن در شهر، یک پهپاد که بر فراز کوه‌های برفی پرواز می‌کند، یا یک ربات که درون انبار مسیر‌یابی می‌کند.»

«آناستاسیس جرمَنیدیس»، مدیر ارشد فناوری Runway، درباره این مدل‌ها توضیح می‌دهد:

«برای ساخت یک مدل جهانی، ابتدا باید یک مدل ویدیویی فوق‌العاده می‌ساختیم. باور داریم که بهترین مسیر رسیدن به شبیه‌سازی همه‌منظوره، آموزش مدل برای پیش‌بینی مستقیم پیکسل‌ها است. وقتی مدل در مقیاس کافی و با داده‌های درست آموزش ببیند، می‌تواند به درکی بنیادین از نحوه کارکرد جهان دست پیدا کند.»

Runway چند ورژن ویژه از مدل جدید را با عنوان‌های GWM-Worlds ،GWM-Robotics و GWM-Avatars معرفی کرده است.

بیشتر بخوانید:  چگونه هوش مصنوعی وام‌دهی آنلاین را متحول می‌کند؛ وقتی همه برنده‌اند

GWM-Worlds یک اپلیکیشن مبتنی‌بر مدل است که امکان تولید پروژه‌های تعاملی را فراهم می‌کند. یوزران با این قابلیت می‌توانند با یک پرامپت یا تصویر مرجع، صحنه موردنظر خود را تولید و در آن کاوش کنند. شرکت اعلام کرده این شبیه‌سازی با نرخ ۲۴ فریم‌برثانیه و رزولوشن ۷۲۰p اجرا می‌شود. به گفته Runway، این ویژگی نه‌تنها برای توسعه بازی‌ها یوزرد دارد، بلکه می‌تواند برای آموزش نحوه حرکت و رفتار عامل‌های هوشمند در جهان فیزیکی نیز مفید باشد.

در ورژن GWM-Robotics بر تولید داده‌های مصنوعی تمرکز شده و برای ورژن GWM-Avatars نیز این شرکت درحال توسعه آواتارهای بسیار واقع‌گرایانه برای شبیه‌سازی رفتار انسان است. نیز ورژن GWM-Robotics با یک SDK ارائه خواهد شد و مذاکرات فعالی با چندین شرکت رباتیک و سازمان‌های تجاری برای استفاده از GWM-Robotics و GWM-Avatars در جریان است.

به گفته شرکت، این ۳ ورژن فعلاً مدل‌های مستقلی هستند، اما در نهایت هدف Runway ادغام تمام این قابلیت‌ها در یک مدل واحد است.

در کنار معرفی این مدل جهان‌محور، Runway ورژن جدیدی از مدل پایه Gen 4.5 را ارائه کرده است. این به‌روزرسانی جدید قابلیت صوتی بومی و تولید ویدیوی بلندمدت چندشاتی را به مدل اضافه می‌کند. به گفته شرکت، یوزران با این آپدیت می‌توانند ویدیوهای یک‌دقیقه‌ای را با حفظ انسجام کاراکتر، دیالوگ بومی، صدای پس‌زمینه و نماهای پیچیده از زوایای مختلف تولید کنند. نیز امکان اصلاح صوت موجود، افزودن دیالوگ و حتی تدوین ویدیوهای چندشاتی با هر طول دلخواه فراهم شده است.

برچسب‌ها: اپل, استارتاپ, پهپاد, ربات, گوگل

جدیدترین‌ مطالب

مطالب بیشتر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.
برای ادامه، شما باید با قوانین موافقت کنید