گوگل از یک ارتقا بزرگ و بسیار قدرتمند برای قابلیت اصلاح تصویر جمینای رونمایی کرد. این بهروزرسانی که مدل پشت پرده آن Nano banana نام دارد، به یوزران کنترل بسیار دقیقتری در زمینه اصلاح تصاویر میدهد و بهطور خاص مشکل بزرگ حفظ ثبات چهره و جزئیات سوژه را در اصلاحهای متوالی حل میکند.
براساس ریپورت تککرانچ، مدل جدید گوگل که نام رسمی آن Gemini 2.5 Flash Image است، پیش از معرفی رسمی، به صورت ناشناس با نام Nano-Banana در سکوی نرمافزاری ارزیابی هوش مصنوعی LMArena ظاهر شده بود و با عملکرد خیرهکنندهاش، یوزران و کارشناسان را شگفتزده کرد. اکنون گوگل تایید کرده است که این مدل تحسینشده، همان فناوری جدیدی است که درحال اضافهشدن به جمینای است.
هوش مصنوعی اصلاح تصویر Nano Banana در جمینای گوگل



تمرکز اصلی این ارتقا روی حل یکی از بزرگترین مشکلات هوش مصنوعی مولد تصویر است: حفظ ثبات شخصیت. از این پس، میتوانید یک عکس از دوستان، خانواده یا حتی حیوانات خانگی خود را اصلاح کنید و مطمئن باشید که چهره و ظاهر آنها در اصلاحهای مختلف (مانند تغییر مدل مو، لباس یا حتی کل صحنه) ثابت و واقعی باقی میماند.


علاوهبراین، قابلیتهای پیشرفته دیگری نیز اضافه شده است؛ یوزران میتوانند چندین عکس را بارگذاری کنند و از هوش مصنوعی بخواهند تا آنها را در یک صحنه جدید و منسجم ترکیب کند. نیز میتوانید سبک بصری یک تصویر (مانند الگوی یک گل) را بر روی یک شیء در تصویر دیگر اعمال کنید (مثلاً آن را به طرح یک لباس تبدیل کنید). نیز یوزران میتوانند به صورت متوالی و مرحله به مرحله، اجزای مختلف یک تصویر را تغییر دهند، بدون اینکه اصلاحهای قبلی از بین برود.


این بهروزرسانی در بحبوحه رقابتی شدید در بازار هوش مصنوعی صورت میگیرد. پس از آنکه OpenAI با ابزارهای تصویرسازی خود در ChatGPT توانست یوزران زیادی را جذب کند، گوگل نیز در تلاش است با ارائه ابزارهای قدرتمندتر، این فاصله را جبران کند. درحالحاضر، ChatGPT بیش از ۷۰۰ میلیون یوزر هفتگی دارد، درحالیکه جمینای ۴۵۰ میلیون یوزر ماهانه را ثبت کرده است.




گوگل نیز با درسگرفتن از مشکلات گذشته (مانند تولید تصاویر تاریخی نادرست) تدابیر ایمنی جدیدی را نیز در نظر گرفته است. تمام تصاویر تولید یا اصلاح شده با این ابزار جدید، دارای یک واترمارک قابل دیدن و یک واترمارک نامرئی (SynthID) خواهند بود تا به راحتی از تصاویر واقعی قابل تشخیص باشند. علاوهبراین، قوانین سختگیرانهای برای جلوگیری از تولید محتوای مضر، مانند تصاویر خصوصی، اعمال شده است.
این قابلیتهای جدید به تدریج برای تمام یوزران در اپلیکیشن جمینای و نیز برای توسعهدهندگان با سکوی نرمافزاریهای رابط برنامهنویسی گوگل در دسترس قرار میگیرد.