Top Layout Campaign banner

تغییرات اخیر

در اینجا اطلاعیه‌ها، نسخه‌ها و تغییرات جدید لیارا فهرست می‌شوند.

هوش مصنوعی نانو بنانا چیست؟ معرفی جادوی جدید گوگل


۲۸ فروردین ۱۴۰۵

خلاصه کنید:

openaigeminiperplexity

تصور کنید بتوانید یک کاراکتر خلق کنید و در تمام تصاویر بعدی، چهره و استایل او را کاملا ثابت نگه دارید. این همان رویایی بود که با ابزارهای قبلی ممکن نمی‌شد، اما گوگل با نانو بنانا قواعد بازی را تغییر داده است. این مدل جدید در کمتر از دو هفته 500 میلیون تصویر تولید کرده، فقط برای سرگرمی نیست؛ بلکه قدرتمندترین ابزار برای ویرایش دقیق و ساخت سناریوهای حرفه‌ای است.

در ادامه خواهید خواند:

  • نانو بنانا (Nano Banana) چیست؟
  • نحوه استفاده از نانو بنانا
  • کاربردهای نانو بنانا
  • محدودیت‌های نانو بنانا
  • جمع بندی

نانو بنانا (Nano Banana) چیست؟

نانو بنانا (Nano Banana) نام رمز آخرین بروزرسانی مدل تولید تصویر Gemini 2.5 Flash گوگل است. کاربران می‌توانند با استفاده از دستورات زبان طبیعی، از روی متن تصاویر جدید خلق کنند، آن‌ها را بهبود بخشند، ریمیکس‌کنند، تصاویر موجود را ویرایش کرده و چندین تصویر را در یک ترکیب‌بندی ادغام کنند.

بر اساس تست‌های اولیه و نظرات کاربران، نانو بنانا عملکرد بسیار خوبی در ویرایش تصاویر موجود دارد و در حفظ ثبات سوژه و جزئیات، بسیار بهتر از بسیاری از ابزارهای قدیمی عمل می‌کند. در مقایسه‌های مستقیم با میدجورنی، این ابزار صحنه‌هایی واقع‌گرایانه تولید کرده است که از نظر نورپردازی، بافت‌ها و فضاسازی، تطابق بسیار نزدیک‌تری با دستورات کاربر دارند.

ویژگی‌هایی که نانو بنانا را متمایز می‌کند:

  • حفظ ظاهر و حس‌وحال سوژه در بین چندین تصویر و موقعیت‌های مختلف.
  • استفاده از زبان طبیعی برای تغییر عناصر خاص در تصویر، مانند پس‌زمینه، اشیا، رنگ‌ها یا بافت‌ها.
  • استفاده از دانش درونی درباره جهان واقعی برای اجرای دستورات پیچیده و چندمرحله‌ای.
  • وجود اپلیکیشن‌های آماده در Google AI Studio که تست ماکت‌های محصول، ثبات کاراکتر و جریان‌های کاری ویرایش را آسان می‌کند.
  • استفاده از واترمارک؛ به طوری که تمام خروجی‌ها شامل یک واترمارک نامرئی برای اصالت‌سنجی و ردیابی اخلاقی باشند.
با سرویس Google Gemini لیارا، تولید متن و تصویر رو با قدرت پردازشی بالا به پروژه‌هات اضافه کن.
✅ پردازش قدرتمند ✅ تولید تصویر ✅ دسترسی API
خرید و راه‌اندازی Gemini

نحوه استفاده از نانو بنانا

شما می‌توانید کار با نانو بنانا را به چندین روش آغاز کنید: از طریق رابط کاربریGemini یا Google AI Studio (که برای اهداف آزمایشگاهی مناسب است)، ادغام نانو بنانا در اپلیکیشن‌ها از طریق Gemini API و یا از طریق Vertex AI برای استفاده سازمانی.

استفاده از نانو بنانا از طریق Gemini

1. وارد حساب کاربری Google Gemini شوید (این قابلیت در اپلیکیشن موبایل نیز در دسترس است).

2. از بخش ابزارها (Tools)، گزینه Nano Banana Create images را انتخاب کنید.

3. پرامپت خود را با جزئیاتی مانند سوژه، حال‌وهوا، نورپردازی و هدف نهایی بنویسید و سپس روی آیکون Submit در سمت راست کلیک کنید. برای ویرایش یا ادغام چندین تصویر، از دکمه + استفاده کنید، تصاویر خود را آپلود کرده و دستورات خاص و دقیقی ارائه دهید.

4. چند ثانیه صبر کنید تا مدل تصویر را تولید کند. با تغییر دادن دستورات یا آپلود مجدد ورودی‌ها، نتیجه را مرحله‌به‌مرحله بهبود دهید تا مدل را به سمت دلخواه هدایت کنید.

5. تصویر نهایی را برای استفاده در پروژه خود دانلود کنید.

استفاده از نانو بنانا از طریق Google AI Studio

1. وارد Google AI Studio شوید.

2. روی گزینه Try Nano Banana کلیک کنید.

3. پرامپت را وارد کنید.

4. روی Run کلیک کنید تا تصویر خروجی را ببینید و در صورت نیاز آن را دانلود کنید.

استفاده از نانو بنانا از طریق Gemini API

1. از Gemini API برای تنظیم احراز هویت استفاده کنید و Gemini SDK را نصب کرده یا از اندپوینت‌های REST استفاده نمایید.

2. مدل flash-image با شناسه models/gemini-2.5-flash-image-preview را انتخاب کنید.

3. درخواست‌ها را به یکی از این صورت‌ها ارسال کنید:

  • پرامپت‌های فقط متنی برای تبدیل متن به تصویر.
  • متن + تصویر برای ویرایش
  • چندین تصویر+ متن برای ترکیب بندی

4. خروجی تصویر را پردازش کنید (فرمت PNG تا رزولوشن 1024*1024 پیکسل).

معرفی جمینی (Gemini)، پیشرفته ترین مدل هوش مصنوعی گوگل
Gemini چیست؟

کاربردهای نانو بنانا

پرامپت‌های ساختار یافته که فاکتورهای مشخصی مانند حال‌وهوا، چیدمان و نورپردازی را تعیین می‌کنند، به شما کمک می‌کنند تا بیشترین بهره را از نانو بنانا ببرید. پرامپت‌های خوب به مدل کمک می‌کنند تا بفهمد شما چه چیزی می‌خواهید و چگونه آن را می‌خواهید. در زیر استراتژی‌هایی آورده شده که می‌توانید برای تولید تصویر امتحان کنید. گوگل دستورالعمل‌هایی را درباره نحوه ساخت پرامپت‌های موثر برای نانو بنانا منتشر کرده است و ما مهم‌ترین نکات را در اینجا خلاصه کرده‌ایم.

1. از پرامپت‌های توصیفی برای تعریف زمینه (Context) استفاده کنید

به جای پرتاب کردن چند کلمه گسسته و بی‌ربط، نوشتن یک توصیف کامل که صحنه را ترسیم کند، خروجی‌های بهتری خواهد داد. مدل به زبان توصیفی و طبیعی پاسخ بهتری می‌دهد زیرا از تعبیه‌های متنی برای درک روابط بین اشیا، نورپردازی و حال و هوا استفاده می‌کند. هدف را در پرامپت بگنجانید تا ترکیب‌بندی و خوانایی با کاربرد نهایی مطابقت داشته باشد.

وقتی شما یک محیط را در قالب جملات توصیف می‌کنید، مکانیزم‌های توجه مدل می‌توانند توکن‌ها، مثلا سگ، میز چوبی، نور محیطی ملایم را با ویژگی‌های بصری خاص در طول فرآیند نویزگیری در مدل انتشار هماهنگ کنند.

این کار تولید یک تصویر منسجم را آسان‌تر می‌کند؛ جایی که چیدمان، سایه‌ها و بافت‌ها به طور طبیعی با یکدیگر ترکیب می‌شوند، به‌جای اینکه به‌صورت عناصر جداگانه یا ناهماهنگ ظاهر شوند.

2. چندین تصویر ارائه دهید

چه در حال ویرایش تصاویر موجود باشید و چه در حال ترکیب چندین ورودی، دادن مراجع بصری و دستورالعمل‌های واضح به مدل کمک می‌کند تا ثبات را حفظ کند. حالت ویرایش کل تصویر را دوباره تولید نمی‌کند، بلکه ناحیه مورد نظر را از پرامپتی که ارائه می‌دهید شناسایی می‌کند.

برای مثال، اگر بخواهید مبل در عکس اتاق نشیمن را ویرایش کنید، مدل فقط پیکسل‌های آن ناحیه را بازسازی می‌کند. بقیه تصویر دست‌نخورده باقی می‌ماند، بنابراین ویرایش‌ها طبیعی‌تر به نظر می‌رسند و زمینه اصلی حفظ می‌شود.

وقتی چندین تصویر را به‌عنوان ورودی می‌دهید، می‌توانید عناصر یا سبک‌های دو یا چند تصویر را در یک خروجی واحد با راهنمایی پرامپت خود ادغام کنید. برای ترکیب چندین تصویر، تمام ورودی‌های مرتبط را بگنجانید تا مدل بتواند استایل‌ها و ترکیب‌بندی را هماهنگ کند.

  • یاد بگیرید چطور یک اپلیکیشن کامل ساخت پرامپت تصویر با پایتون و Streamlit بسازید.
  • بررسی کنید که چگونه Fooocus با استفاده از ابزارهای پیشرفته‌ای مثل ControlNet فرآیند Stable Diffusion را ساده می‌کند.
  • کشف کنید که مدل Sana شرکت NVIDIA چگونه با رزولوشن 4096*4096 مرزها را جابجا می‌کند.

3. از پرامپت‌های متناقض پرهیز کنید و از پرامپت‌های منفیِ معنایی استفاده کنید

جزئیات متضاد مدل را گیج می‌کنند و ممکن است منجر به توهمات هوش مصنوعی شوند. مطمئن شوید که توضیحات شما یک صحنه واحد و منسجم را تشکیل می‌دهند نه ترکیبی از دستورات ناسازگار.

گوگل همچنین توصیه می‌کند از پرامپت‌های منفی معنایی استفاده کنید. یعنی به‌جای لیست کردن موارد حذفی، وضعیت مطلوب را با واژگان مثبت توصیف کنید تا از درگیری‌های معنایی جلوگیری شود.

4. رویکردی تکرارپذیر (Iterative) و مکالمه‌محور داشته باشید

پرامپت‌نویسی وقتی به عنوان یک فرآیند اصلاح و بهبود (Refinement) دیده شود، نتایج مطلوب‌تری می‌دهد. می‌توانید ساده شروع کنید، خروجی را بررسی کنید و سپس جزئیات را اضافه کرده یا مواردی

د. این رویکرد تکرارپذیر و مکالمه‌محور به هدایت قدم‌به‌قدم مدل کمک می‌کند، به‌جای اینکه در یک تلاش واحد، آن را با دستورات متناقض یا بیش از حد پیچیده بمباران کنید.

کاربرد جمینی چیست؟ نگاهی به هوش مصنوعی جدید و پیشرفته گوگل
کاربرد جمینی چیست؟

محدودیت‌های نانو بنانا

اگرچه نانو بنانا قابلیت‌های تولید و ویرایش تصویر را ارائه می‌‌دهد، اما محدودیت‌هایی نیز دارد. درک این مرزها به ایجاد انتظارات واقع‌بینانه برای کاربردهای دنیای واقعی کمک می‌کند.

پشتیبانی محدود زبانی

  • زبان‌های اصلی: بهترین عملکرد را در انگلیسی، اسپانیایی (مکزیک)، ژاپنی، چینی ساده‌شده و هندی دارد.
  • سایر زبان‌ها: ممکن است کار کنند اما دقت و ثبات کمتری دارند.
  • ریسک چندزبانه: استفاده در پروژه‌های چندزبانه غیرقابل پیش‌بینی است.
  • نیاز به بررسی: صنایعی که مخاطبان متنوع دارند باید خروجی‌ها را به دقت اعتبارسنجی کنند.

محدودیت‌های رزولوشن

  • حداکثر کیفیت: خروجی محدود به فرمت PNG و سایز 1024 پیکسل است.
  • کاربرد مناسب: نمایشگرهای دیجیتال و نمونه‌سازی.
  • کاربرد نامناسب: چاپ با کیفیت بالا و تصاویر ابعاد بزرگ.
  • چالش بزرگ‌نمایی: استفاده از ابزارهای Upscaling ممکن است باعث تاری یا ایجاد نویز در تصویر شود.

عدم ثبات در محیط عملیاتی (Production)

  • فاز آزمایشی: مدل در حالت Preview است و ممکن است تغییر کند.
  • تغییرات ناگهانی: امکان حذف یا آپدیت ویژگی‌ها وجود دارد.
  • ناسازگاری: رفتار مدل ممکن است در زمان‌های مختلف متفاوت باشد.
  • نتیجه‌گیری: فعلا برای تست مناسب است و برای استفاده در محصولات نهایی ریسک دارد.

محدودیت‌های پشتیبانی ورودی

  • فقط متن و عکس: تنها ورودی‌های متنی و تصویری پشتیبانی می‌شوند.
  • عدم پشتیبانی مدیا: فایل‌های صوتی یا ویدیویی پذیرفته نمی‌شوند.
  • تولید ویدیو: امکان تولید مستقیم ویدیو وجود ندارد.
  • راهکار: برای ویدیو باید از ابزارهای جانبی در کنار نانو بنانا استفاده کرد.

سهمیه‌ها و محدودیت‌های استفاده

  • کنترل مصرف: استفاده بر اساس سهمیه، توکن و نرخ درخواست محدود شده است.
  • تاخیر احتمالی: درخواست‌های زیاد یا سنگین ممکن است باعث کندی شوند.
  • نیاز توسعه‌دهندگان: باید پرامپت‌های پیچیده را تقسیم کرده و بر میزان مصرف نظارت کنند.
۱۰ ویرایشگر برتر هوش مصنوعی تصویر در سال ۲۰۲۵
بهترین ویرایشگرهای هوش مصنوعی

جمع بندی

نانو بنانا فراتر از یک ابزار سرگرمی، راه‌حلی هوشمندانه برای چالش قدیمی حفظ ثبات سوژه در هوش مصنوعی است. اگرچه این مدل هنوز در فاز آزمایشی است و محدودیت‌هایی در رزولوشن دارد، اما ترکیب سرعت بالا و درک عمیق از زبان طبیعی، آن را به گزینه‌ای ایده‌آل برای نمونه‌سازی سریع و پرامپت‌های خلاقانه تبدیل کرده است.

پیشنهاد می‌کنیم همین حالا آزمایش آن را شروع کنید تا پیش از دیگران، بر موج آینده تولید محتوای بصری سوار شوید.