生成精准、高质量的图像往往需要无数次试错。你需要一个真正理解你意图的模型。
基于 Gemini 3 模型家族,Nano Banana 2 运用深度推理能力,在生成图像之前充分理解你的提示词。本指南分享了经过大量测试验证的提示词策略和框架,帮助你获得最佳效果。
✨ 免费体验 Nano Banana 2 — 立即前往 yesnanobanana2.com 开始创作
模型概览
Nano Banana 是先进的图像生成与编辑模型,利用真实世界知识和深度推理能力输出精准、丰富的视觉结果。Nano Banana 2 在三个关键领域表现突出:
- 更精准的视觉效果: Nano Banana 2 由实时网络搜索信息和图像驱动,这意味着更好的教育工具、本地化营销、旅行应用等。
- 快速的专业级功能: 高级功能全面解锁——从文字渲染与翻译,到 2K/4K 超分放大。创意团队可以构建连贯的叙事、分镜脚本和产品原型。
- 精准控制: 生成或编辑图像以适配任何项目需求,原生支持 16:9、9:16、2:1 等多种比例。无论是海报、营销原型还是广告,都能呈现鲜艳的光影和丰富的纹理。
技术规格详解
在深入提示词技巧之前,先了解模型的能力边界:
上下文窗口
- Nano Banana 2(Gemini 3.1 Flash Image):最大 131,072 输入 token
- Nano Banana Pro(Gemini 3 Pro Image):最大 65,536 输入 token
- 两个模型均支持最大 32,768 输出 token
分辨率
两个模型均内置 1K、2K 和 4K 生成能力。Nano Banana 2 额外增加了 512px(0.5K)的较小分辨率选项。
宽高比
两个模型均支持:1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9。
Nano Banana 2 额外增加:1:4、4:1、1:8、8:1 宽高比。
图像输入
单个提示词中最多可混合使用 14 张参考图像。支持的格式包括 PNG、JPEG、WebP、HEIC 和 HEIF。
安全与信任
所有生成的图像均包含 C2PA Content Credentials 和 SynthID 水印。
高效提示词的核心原则
以下是确保获得你实际想要的视觉效果的核心准则:
- 具体明确 — 提供主体、灯光和构图的具体细节。
- 正向描述 — 描述你想要什么,而不是不想要什么(例如用"空旷的街道"代替"没有车的街道")。
- 控制镜头 — 使用摄影和电影术语,如"low angle"(低角度)和"aerial view"(航拍视角)。
- 迭代优化 — 通过对话式的后续提示词逐步精修图像。
关键点是以一个强动词开头,告诉模型你想要执行的主要操作。
五大提示词框架
一、图像生成
提示词结构取决于你是使用参考图像还是纯文字描述。
纯文字生图(无参考图)
从空白画布开始时,你就是导演。简单的关键词列表远远不够——你需要叙事性地描述场景。
公式: [主体] + [动作] + [地点/背景] + [构图] + [风格]
示例提示词:
"[Subject] A striking fashion model wearing a tailored brown dress, sleek boots, and holding a structured handbag. [Action] Posing with a confident, statuesque stance, slightly turned. [Location/context] A seamless, deep cherry red studio backdrop. [Composition] Medium-full shot, center-framed. [Style] Fashion magazine style editorial, shot on medium-format analog film, pronounced grain, high saturation, cinematic lighting effect."
多模态生成(有参考图)
Nano Banana 2 允许你组合多张参考图像来引导最终输出,非常适合保持角色一致性或将特定产品融入新环境。
公式: [参考图像] + [关系指令] + [新场景]
示例提示词:
"Using the attached napkin sketch as the structure and the attached fabric sample as the texture [References], transform this into a high-fidelity 3D armchair render [Relationship]. Place it in a sun-drenched, minimalist living room [New Scenario]."
(使用附带的餐巾纸草图作为结构、附带的布料样本作为纹理 [参考],将其转换为高保真 3D 扶手椅渲染 [关系]。放置在阳光充沛的极简主义客厅中 [新场景]。)
二、图像编辑
编辑与生成的思维方式不同。你已经有了基础图像,提示词需要聚焦于哪些要改变、哪些要保持不变。
对话式编辑(无新参考图)
当你生成图像后想通过对话方式微调:
- 语义蒙版(局部重绘): 你可以通过文字定义一个"蒙版",编辑图像的特定部分,同时保持其余部分不变。
- 提示词技巧: 明确说明哪些部分需要保持完全不变。
示例提示词: "Remove the man from the photo"(移除照片中的男人)
构图与风格迁移(有新参考图)
在提示词中引入新图像来修改现有作品:
- 添加元素: 上传基础图像和物体图像,让模型将它们组合在一起。
- 风格迁移: 上传一张照片,要求模型以不同的艺术风格重新创作其内容,例如将现代城市街景照片转换为梵高风格的绘画。
三、基于实时网络搜索生图
Nano Banana 2 能够主动搜索网络,基于实时信息生成图像。
你不是描述一个虚构场景,而是指示模型检索真实世界数据,然后指定如何将其可视化。
公式: [搜索请求] + [分析任务] + [视觉转化]
示例提示词:
"[Search for current weather and date in San Francisco] + [Use this data to modify the scene — if raining, make it look grey and rainy] + [Visualize this in a miniature city-in-a-cup concept embedded within a realistic, modern smartphone UI]."
([搜索旧金山当前天气和日期] + [使用这些数据来修改场景——如果下雨,呈现灰暗雨天效果] + [在逼真的现代智能手机 UI 中,以微缩"杯中城市"概念可视化]。)
这一功能帮助团队创建更准确、更贴合语境的视觉作品。
四、文字渲染与本地化
Nano Banana 2 和 Nano Banana Pro 擅长为海报、图表和产品原型渲染清晰、易读的文字,并支持超过 10 种语言的顶尖多语言文字生成。
为获得最佳排版效果,请遵循以下规则:
- 使用引号: 用引号括住你想要的文字(例如 "Happy Birthday" 或 "URBAN EXPLORER")。
- 指定字体: 描述排版风格或命名字体。提示 "bold, white, sans-serif font" 或 "Century Gothic 12px font"。
- 翻译与本地化: 用一种语言写提示词,并为文字输出指定目标语言。
- 文字优先技巧: 当需要在图像中生成文字时,先通过对话让模型生成文字方案,然后再要求生成包含该文字的图像。
示例提示词:
"A high-end, glossy commercial beauty shot of a sleek, minimalist nude-colored face moisturizer jar resting on a warm studio background. The lighting is soft and radiant. Next to the product, render three lines of text with the following exact styling: For the top line, the word 'GLOW' in a flowing, elegant Brush Script font. For the middle line, the text '10% OFF' in a heavy, blocky Impact font. For the bottom line, the text 'Your First Order' in a thin, minimalist Century Gothic font. Then translate the text into Korean and Arabic."
五、像创意总监一样写提示词
想要将结果从"还不错"提升到"令人惊叹",你需要停止堆砌关键词,开始像导演一样调度场景。
设计你的灯光
准确告诉模型场景的照明方式。
- 影棚设置: 要求 "three-point softbox setup"(三点柔光箱布置)来均匀照亮产品。
- 戏剧效果: 提示 "Chiaroscuro lighting with harsh, high contrast"(明暗对照灯光,强烈高对比)或 "Golden hour backlighting creating long shadows"(黄金时段逆光制造长影)。
选择你的相机、镜头和焦点
使用具体的硬件和摄影术语来控制画面的景深、畸变和透视。
- 硬件: 指定相机类型来改变图像的视觉基因。要求用 GoPro 拍摄获得沉浸式广角感,用 Fujifilm 获得真实的色彩科学,或用廉价一次性相机获得粗粝的怀旧闪光灯美学。
- 镜头: 通过请求 "low-angle shot with a shallow depth of field (f/1.8)" 来控制透视。需要展示宏大场景时用 "wide-angle lens"(广角镜头),需要精致细节时指定 "macro lens"(微距镜头)。
定义色彩分级和胶片质感
最终图像的纹理和色彩决定了情感基调。
- 怀旧或粗粝风格:"Render as if on 1980s color film, slightly grainy"(如同在 1980 年代彩色胶片上拍摄,略带颗粒感)
- 现代沉郁风格:"Cinematic color grading with muted teal tones"(电影级调色,低饱和青色调)
强调材质与纹理
生成 Logo、产品或角色时,定义其物理质感。不要只说"西装外套"——要说 "navy blue tweed"(海军蓝粗花呢)。不要只说"盔甲"——描述 "ornate elven plate armor, etched with silver leaf patterns"(华丽的精灵板甲,蚀刻银叶纹理)。设计原型时,指定表面材质,如 "minimalist ceramic coffee mug"(极简陶瓷咖啡杯)。
进阶:多模型协作工作流
Nano Banana 2 设计为可与其他生成式创作模型无缝协作:
- Nano Banana + Gemini: Gemini 3 可以帮助你创建提示词并提供创意方向指导。
- Nano Banana + Veo: 用 Nano Banana 创建关键帧来指导动画,然后用 Veo 生成帧与帧之间的视频。
- Nano Banana + Veo + Lyria: 生成项目的视觉素材,然后用 Lyria 添加定制 AI 配乐。
立即开始使用 Nano Banana 2
准备好将这五大提示词框架付诸实践了吗?Nano Banana 2 现已上线——基于 Gemini 3.1 Flash Image,数秒生成专业级图像。

