رقیب فتوشاپ؛ مدل ویرایش تصویر Nano Banana به جمینای اضافه شد

بدون دیدگاه
رقیب فتوشاپ؛ مدل ویرایش تصویر Nano Banana به جمینای اضافه شد

گوگل از یک ارتقا بزرگ و بسیار قدرتمند برای قابلیت اصلاح تصویر جمینای رونمایی کرد. این به‌روزرسانی که مدل پشت پرده آن Nano banana نام دارد، به یوزران کنترل بسیار دقیق‌تری در زمینه اصلاح تصاویر می‌دهد و به‌طور خاص مشکل بزرگ حفظ ثبات چهره و جزئیات سوژه را در اصلاح‌های متوالی حل می‌کند.

براساس ریپورت تک‌کرانچ، مدل جدید گوگل که نام رسمی آن Gemini 2.5 Flash Image است، پیش از معرفی رسمی، به صورت ناشناس با نام Nano-Banana در سکوی نرم‌افزاری ارزیابی هوش مصنوعی LMArena ظاهر شده بود و با عملکرد خیره‌کننده‌اش، یوزران و کارشناسان را شگفت‌زده کرد. اکنون گوگل تایید کرده است که این مدل تحسین‌شده، همان فناوری جدیدی است که درحال اضافه‌شدن به جمینای است.

هوش مصنوعی اصلاح تصویر Nano Banana در جمینای گوگل

تمرکز اصلی این ارتقا روی حل یکی از بزرگ‌ترین مشکلات هوش مصنوعی مولد تصویر است: حفظ ثبات شخصیت. از این پس، می‌توانید یک عکس از دوستان، خانواده یا حتی حیوانات خانگی خود را اصلاح کنید و مطمئن باشید که چهره و ظاهر آن‌ها در اصلاح‌های مختلف (مانند تغییر مدل مو، لباس یا حتی کل صحنه) ثابت و واقعی باقی می‌ماند.

علاوه‌براین، قابلیت‌های پیشرفته دیگری نیز اضافه شده است؛ یوزران می‌توانند چندین عکس را بارگذاری کنند و از هوش مصنوعی بخواهند تا آن‌ها را در یک صحنه جدید و منسجم ترکیب کند. نیز می‌توانید سبک بصری یک تصویر (مانند الگوی یک گل) را بر روی یک شیء در تصویر دیگر اعمال کنید (مثلاً آن را به طرح یک لباس تبدیل کنید). نیز  یوزران می‌توانند به صورت متوالی و مرحله به مرحله، اجزای مختلف یک تصویر را تغییر دهند، بدون اینکه اصلاح‌های قبلی از بین برود.

این به‌روزرسانی در بحبوحه رقابتی شدید در بازار هوش مصنوعی صورت می‌گیرد. پس از آنکه OpenAI با ابزارهای تصویرسازی خود در ChatGPT توانست یوزران زیادی را جذب کند، گوگل نیز در تلاش است با ارائه ابزارهای قدرتمندتر، این فاصله را جبران کند. درحال‌حاضر، ChatGPT بیش از ۷۰۰ میلیون یوزر هفتگی دارد، درحالی‌که جمینای ۴۵۰ میلیون یوزر ماهانه را ثبت کرده است.

گوگل نیز با درس‌گرفتن از مشکلات گذشته (مانند تولید تصاویر تاریخی نادرست) تدابیر ایمنی جدیدی را نیز در نظر گرفته است. تمام تصاویر تولید یا اصلاح شده با این ابزار جدید، دارای یک واترمارک قابل دیدن و یک واترمارک نامرئی (SynthID) خواهند بود تا به راحتی از تصاویر واقعی قابل تشخیص باشند. علاوه‌براین، قوانین سخت‌گیرانه‌ای برای جلوگیری از تولید محتوای مضر، مانند تصاویر خصوصی، اعمال شده است.

این قابلیت‌های جدید به تدریج برای تمام یوزران در اپلیکیشن جمینای و نیز برای توسعه‌دهندگان با سکوی نرم‌افزاری‌های رابط برنامه‌نویسی گوگل در دسترس قرار می‌گیرد.

برچسب‌ها: ChatGPT, اپل, جمینای

جدیدترین‌ مطالب

مطالب بیشتر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.
برای ادامه، شما باید با قوانین موافقت کنید