آنچه در این مقاله میخوانید
هوش مصنوعی نانو بنانا چیست؟ معرفی جادوی جدید گوگل
۲۸ فروردین ۱۴۰۵
تصور کنید بتوانید یک کاراکتر خلق کنید و در تمام تصاویر بعدی، چهره و استایل او را کاملا ثابت نگه دارید. این همان رویایی بود که با ابزارهای قبلی ممکن نمیشد، اما گوگل با نانو بنانا قواعد بازی را تغییر داده است. این مدل جدید در کمتر از دو هفته 500 میلیون تصویر تولید کرده، فقط برای سرگرمی نیست؛ بلکه قدرتمندترین ابزار برای ویرایش دقیق و ساخت سناریوهای حرفهای است.
در ادامه خواهید خواند:
- نانو بنانا (Nano Banana) چیست؟
- نحوه استفاده از نانو بنانا
- کاربردهای نانو بنانا
- محدودیتهای نانو بنانا
- جمع بندی

نانو بنانا (Nano Banana) چیست؟
نانو بنانا (Nano Banana) نام رمز آخرین بروزرسانی مدل تولید تصویر Gemini 2.5 Flash گوگل است. کاربران میتوانند با استفاده از دستورات زبان طبیعی، از روی متن تصاویر جدید خلق کنند، آنها را بهبود بخشند، ریمیکسکنند، تصاویر موجود را ویرایش کرده و چندین تصویر را در یک ترکیببندی ادغام کنند.
بر اساس تستهای اولیه و نظرات کاربران، نانو بنانا عملکرد بسیار خوبی در ویرایش تصاویر موجود دارد و در حفظ ثبات سوژه و جزئیات، بسیار بهتر از بسیاری از ابزارهای قدیمی عمل میکند. در مقایسههای مستقیم با میدجورنی، این ابزار صحنههایی واقعگرایانه تولید کرده است که از نظر نورپردازی، بافتها و فضاسازی، تطابق بسیار نزدیکتری با دستورات کاربر دارند.
ویژگیهایی که نانو بنانا را متمایز میکند:
- حفظ ظاهر و حسوحال سوژه در بین چندین تصویر و موقعیتهای مختلف.
- استفاده از زبان طبیعی برای تغییر عناصر خاص در تصویر، مانند پسزمینه، اشیا، رنگها یا بافتها.
- استفاده از دانش درونی درباره جهان واقعی برای اجرای دستورات پیچیده و چندمرحلهای.
- وجود اپلیکیشنهای آماده در Google AI Studio که تست ماکتهای محصول، ثبات کاراکتر و جریانهای کاری ویرایش را آسان میکند.
- استفاده از واترمارک؛ به طوری که تمام خروجیها شامل یک واترمارک نامرئی برای اصالتسنجی و ردیابی اخلاقی باشند.
با سرویس Google Gemini لیارا، تولید متن و تصویر رو با قدرت پردازشی بالا به پروژههات اضافه کن.
✅ پردازش قدرتمند ✅ تولید تصویر ✅ دسترسی API
خرید و راهاندازی Gemini
نحوه استفاده از نانو بنانا
شما میتوانید کار با نانو بنانا را به چندین روش آغاز کنید: از طریق رابط کاربریGemini یا Google AI Studio (که برای اهداف آزمایشگاهی مناسب است)، ادغام نانو بنانا در اپلیکیشنها از طریق Gemini API و یا از طریق Vertex AI برای استفاده سازمانی.
استفاده از نانو بنانا از طریق Gemini
1. وارد حساب کاربری Google Gemini شوید (این قابلیت در اپلیکیشن موبایل نیز در دسترس است).
2. از بخش ابزارها (Tools)، گزینه Nano Banana Create images را انتخاب کنید.
3. پرامپت خود را با جزئیاتی مانند سوژه، حالوهوا، نورپردازی و هدف نهایی بنویسید و سپس روی آیکون Submit در سمت راست کلیک کنید. برای ویرایش یا ادغام چندین تصویر، از دکمه + استفاده کنید، تصاویر خود را آپلود کرده و دستورات خاص و دقیقی ارائه دهید.
4. چند ثانیه صبر کنید تا مدل تصویر را تولید کند. با تغییر دادن دستورات یا آپلود مجدد ورودیها، نتیجه را مرحلهبهمرحله بهبود دهید تا مدل را به سمت دلخواه هدایت کنید.
5. تصویر نهایی را برای استفاده در پروژه خود دانلود کنید.
استفاده از نانو بنانا از طریق Google AI Studio
1. وارد Google AI Studio شوید.
2. روی گزینه Try Nano Banana کلیک کنید.
3. پرامپت را وارد کنید.
4. روی Run کلیک کنید تا تصویر خروجی را ببینید و در صورت نیاز آن را دانلود کنید.
استفاده از نانو بنانا از طریق Gemini API
1. از Gemini API برای تنظیم احراز هویت استفاده کنید و Gemini SDK را نصب کرده یا از اندپوینتهای REST استفاده نمایید.
2. مدل flash-image با شناسه models/gemini-2.5-flash-image-preview را انتخاب کنید.
3. درخواستها را به یکی از این صورتها ارسال کنید:
- پرامپتهای فقط متنی برای تبدیل متن به تصویر.
- متن + تصویر برای ویرایش
- چندین تصویر+ متن برای ترکیب بندی
4. خروجی تصویر را پردازش کنید (فرمت PNG تا رزولوشن 1024*1024 پیکسل).
معرفی جمینی (Gemini)، پیشرفته ترین مدل هوش مصنوعی گوگل
Gemini چیست؟
کاربردهای نانو بنانا
پرامپتهای ساختار یافته که فاکتورهای مشخصی مانند حالوهوا، چیدمان و نورپردازی را تعیین میکنند، به شما کمک میکنند تا بیشترین بهره را از نانو بنانا ببرید. پرامپتهای خوب به مدل کمک میکنند تا بفهمد شما چه چیزی میخواهید و چگونه آن را میخواهید. در زیر استراتژیهایی آورده شده که میتوانید برای تولید تصویر امتحان کنید. گوگل دستورالعملهایی را درباره نحوه ساخت پرامپتهای موثر برای نانو بنانا منتشر کرده است و ما مهمترین نکات را در اینجا خلاصه کردهایم.
1. از پرامپتهای توصیفی برای تعریف زمینه (Context) استفاده کنید
به جای پرتاب کردن چند کلمه گسسته و بیربط، نوشتن یک توصیف کامل که صحنه را ترسیم کند، خروجیهای بهتری خواهد داد. مدل به زبان توصیفی و طبیعی پاسخ بهتری میدهد زیرا از تعبیههای متنی برای درک روابط بین اشیا، نورپردازی و حال و هوا استفاده میکند. هدف را در پرامپت بگنجانید تا ترکیببندی و خوانایی با کاربرد نهایی مطابقت داشته باشد.
وقتی شما یک محیط را در قالب جملات توصیف میکنید، مکانیزمهای توجه مدل میتوانند توکنها، مثلا سگ، میز چوبی، نور محیطی ملایم را با ویژگیهای بصری خاص در طول فرآیند نویزگیری در مدل انتشار هماهنگ کنند.
این کار تولید یک تصویر منسجم را آسانتر میکند؛ جایی که چیدمان، سایهها و بافتها به طور طبیعی با یکدیگر ترکیب میشوند، بهجای اینکه بهصورت عناصر جداگانه یا ناهماهنگ ظاهر شوند.
2. چندین تصویر ارائه دهید
چه در حال ویرایش تصاویر موجود باشید و چه در حال ترکیب چندین ورودی، دادن مراجع بصری و دستورالعملهای واضح به مدل کمک میکند تا ثبات را حفظ کند. حالت ویرایش کل تصویر را دوباره تولید نمیکند، بلکه ناحیه مورد نظر را از پرامپتی که ارائه میدهید شناسایی میکند.
برای مثال، اگر بخواهید مبل در عکس اتاق نشیمن را ویرایش کنید، مدل فقط پیکسلهای آن ناحیه را بازسازی میکند. بقیه تصویر دستنخورده باقی میماند، بنابراین ویرایشها طبیعیتر به نظر میرسند و زمینه اصلی حفظ میشود.
وقتی چندین تصویر را بهعنوان ورودی میدهید، میتوانید عناصر یا سبکهای دو یا چند تصویر را در یک خروجی واحد با راهنمایی پرامپت خود ادغام کنید. برای ترکیب چندین تصویر، تمام ورودیهای مرتبط را بگنجانید تا مدل بتواند استایلها و ترکیببندی را هماهنگ کند.
- یاد بگیرید چطور یک اپلیکیشن کامل ساخت پرامپت تصویر با پایتون و Streamlit بسازید.
- بررسی کنید که چگونه Fooocus با استفاده از ابزارهای پیشرفتهای مثل ControlNet فرآیند Stable Diffusion را ساده میکند.
- کشف کنید که مدل Sana شرکت NVIDIA چگونه با رزولوشن 4096*4096 مرزها را جابجا میکند.
3. از پرامپتهای متناقض پرهیز کنید و از پرامپتهای منفیِ معنایی استفاده کنید
جزئیات متضاد مدل را گیج میکنند و ممکن است منجر به توهمات هوش مصنوعی شوند. مطمئن شوید که توضیحات شما یک صحنه واحد و منسجم را تشکیل میدهند نه ترکیبی از دستورات ناسازگار.
گوگل همچنین توصیه میکند از پرامپتهای منفی معنایی استفاده کنید. یعنی بهجای لیست کردن موارد حذفی، وضعیت مطلوب را با واژگان مثبت توصیف کنید تا از درگیریهای معنایی جلوگیری شود.
4. رویکردی تکرارپذیر (Iterative) و مکالمهمحور داشته باشید
پرامپتنویسی وقتی به عنوان یک فرآیند اصلاح و بهبود (Refinement) دیده شود، نتایج مطلوبتری میدهد. میتوانید ساده شروع کنید، خروجی را بررسی کنید و سپس جزئیات را اضافه کرده یا مواردی
د. این رویکرد تکرارپذیر و مکالمهمحور به هدایت قدمبهقدم مدل کمک میکند، بهجای اینکه در یک تلاش واحد، آن را با دستورات متناقض یا بیش از حد پیچیده بمباران کنید.
کاربرد جمینی چیست؟ نگاهی به هوش مصنوعی جدید و پیشرفته گوگل
کاربرد جمینی چیست؟
محدودیتهای نانو بنانا
اگرچه نانو بنانا قابلیتهای تولید و ویرایش تصویر را ارائه میدهد، اما محدودیتهایی نیز دارد. درک این مرزها به ایجاد انتظارات واقعبینانه برای کاربردهای دنیای واقعی کمک میکند.
پشتیبانی محدود زبانی
- زبانهای اصلی: بهترین عملکرد را در انگلیسی، اسپانیایی (مکزیک)، ژاپنی، چینی سادهشده و هندی دارد.
- سایر زبانها: ممکن است کار کنند اما دقت و ثبات کمتری دارند.
- ریسک چندزبانه: استفاده در پروژههای چندزبانه غیرقابل پیشبینی است.
- نیاز به بررسی: صنایعی که مخاطبان متنوع دارند باید خروجیها را به دقت اعتبارسنجی کنند.
محدودیتهای رزولوشن
- حداکثر کیفیت: خروجی محدود به فرمت PNG و سایز 1024 پیکسل است.
- کاربرد مناسب: نمایشگرهای دیجیتال و نمونهسازی.
- کاربرد نامناسب: چاپ با کیفیت بالا و تصاویر ابعاد بزرگ.
- چالش بزرگنمایی: استفاده از ابزارهای Upscaling ممکن است باعث تاری یا ایجاد نویز در تصویر شود.
عدم ثبات در محیط عملیاتی (Production)
- فاز آزمایشی: مدل در حالت Preview است و ممکن است تغییر کند.
- تغییرات ناگهانی: امکان حذف یا آپدیت ویژگیها وجود دارد.
- ناسازگاری: رفتار مدل ممکن است در زمانهای مختلف متفاوت باشد.
- نتیجهگیری: فعلا برای تست مناسب است و برای استفاده در محصولات نهایی ریسک دارد.
محدودیتهای پشتیبانی ورودی
- فقط متن و عکس: تنها ورودیهای متنی و تصویری پشتیبانی میشوند.
- عدم پشتیبانی مدیا: فایلهای صوتی یا ویدیویی پذیرفته نمیشوند.
- تولید ویدیو: امکان تولید مستقیم ویدیو وجود ندارد.
- راهکار: برای ویدیو باید از ابزارهای جانبی در کنار نانو بنانا استفاده کرد.
سهمیهها و محدودیتهای استفاده
- کنترل مصرف: استفاده بر اساس سهمیه، توکن و نرخ درخواست محدود شده است.
- تاخیر احتمالی: درخواستهای زیاد یا سنگین ممکن است باعث کندی شوند.
- نیاز توسعهدهندگان: باید پرامپتهای پیچیده را تقسیم کرده و بر میزان مصرف نظارت کنند.
۱۰ ویرایشگر برتر هوش مصنوعی تصویر در سال ۲۰۲۵
بهترین ویرایشگرهای هوش مصنوعی
جمع بندی
نانو بنانا فراتر از یک ابزار سرگرمی، راهحلی هوشمندانه برای چالش قدیمی حفظ ثبات سوژه در هوش مصنوعی است. اگرچه این مدل هنوز در فاز آزمایشی است و محدودیتهایی در رزولوشن دارد، اما ترکیب سرعت بالا و درک عمیق از زبان طبیعی، آن را به گزینهای ایدهآل برای نمونهسازی سریع و پرامپتهای خلاقانه تبدیل کرده است.
پیشنهاد میکنیم همین حالا آزمایش آن را شروع کنید تا پیش از دیگران، بر موج آینده تولید محتوای بصری سوار شوید.

