在广告行业混过的人都懂:一条片子背后,是数不清的碎片化流程。
前期要策划、写脚本,光头脑风暴就能耗掉好几天;
拍摄要请模特、租场地、布灯光;
后期修图、调色、加字幕,还要反复改。
更要命的是——改稿。
客户一句话,就能让你推翻重来:
- 想看“戴耳机在球场上的效果”?对不起,得再租场地。
- 说“能不能换成医生”?那好,重新找演员,再拍一遍。
每一次修改,都是钱和时间的无底洞。
传统AI出图:好看,却讲不出故事
AI出图不是新鲜事,但它一直有个致命问题:只能生成“单张好图”,撑不起“完整广告叙事”。
要讲故事?角度一换就换脸,风格统一不起来,道具还经常翻车。
转折来了:Nano Banana
所以,当 Google 推出 Nano Banana,我第一时间就想试试——能不能使用Nano Banana制作高质量广告创意素材?
答案是:能。
我的实战流程:用Nano Banana做一条耳机广告
整体流程:
产品原始照片 →锁定人物 →功能点拆解 →场景设定 →输入提示词多轮生成图像素材(先大改,后细调) → 统一调色 → 合成投放。
1. 产品原始照片

2. 锁定人物
别只用一张人物图。最稳的做法是:一张正面清晰人像 + 一张半身或侧脸。
上传参考图,并在提示词首句写明“同一张脸、同样的发型”。这样不同场景里的角色就不会跑偏。

3. 功能点提炼 → 画面场景绑定
首先想清楚
- 产品核心卖点是什么?
- 目标受众是谁?
把产品功能拆成 3–6 个“可视化卖点”,每个卖点对应一个场景和镜头。
耳机示例:
- 降噪 → 夜市/地铁(嘈杂环境对比)
- 稳固佩戴 → 跑步/徒步(动作中耳机不掉)
- 触控操作 → 手部特写(调节、切歌)
- 长续航 → 旅行/雪原(持续陪伴)
- 清晰通话 → 医院/办公(安静、沟通清晰)
- 分享功能 → 看台/路边(分享耳机)
记住:写脚本时,不是写“场景好看”,而是写“场景怎么凸显功能”。
4. 场景文案
为每个场景写一句“广告文案”,方便以后对应转成提示词丢给Nano Banana。
场景A(降噪)
文案:城市再吵,耳边自有安静世界。
场景B(稳固佩戴)
文案:怎么跑都不掉,像贴在耳朵上。
场景C(触控操作)
文案:轻轻一点,音乐随心切换。
场景D(长续航)
文案:一路相伴,音乐从不掉线。
场景E(清晰通话)
文案:再嘈杂,也能清晰沟通。
场景F(分享功能)
文案:音乐分享,快乐加倍。
4. 输入场景提示词生成图片:先大改,后细调
做AI广告图最怕的就是“一次性写满所有要求”,AI不是不行,而是容易乱跑。
最稳的方式就是:分轮迭代,每轮只解决一个问题。
我常用的“三步走”模板是:
- 第一轮:定主体(人设+大背景)
- 第二轮:补细节(光影/动作/道具)
- 第三轮:修精度(手部/边缘/小瑕疵)
拿场景A和场景B为例:
场景A:夜街场景(降噪功能)
第一轮 提示词:
同一张脸,同样发型,人物戴耳机走在霓虹夜街。
👉 得到主体与背景,但耳机细节模糊,光影普通。

第二轮 提示词:
同一张脸,强化霓虹灯反射效果,突出耳机细节,让环境嘈杂但人物表情放松。
👉 背景氛围更强烈,降噪感表现出来。

第三轮 提示词:
同一张脸,细化光影层次,锐化耳机边缘,确保耳机线条自然。

👉 最终图完成,光影统一,耳机细节到位。
场景二:跑步场景(稳固佩戴功能)
第一轮 提示词:
同一张脸,同样发型,人物在山间跑步,戴着耳机。

👉 得到人物和大背景,但动作有些僵硬,耳机贴合感不足。
第二轮 提示词:
同一张脸,强化跑步动态,加入风吹效果和自然运动模糊,耳机清晰贴合耳朵。

👉 动作流畅,跑动氛围更自然。
通过两个对照案例,你能看出不同场景的侧重点:
- 夜街镜头:核心是“光影氛围”
- 跑步镜头:核心是“动作自然”
总结一句话:每一轮只解决一类问题,从粗到细,最后收尾。
注意
多轮修改有的时候几乎没变化: 直接告诉Nano banana, 你没看出什么差别变化,它会重新修改给你。

结论
建议把 Nano Banana 当作“创意与初稿发动机”,最后交给人工做精修与落地。
使用Nano Banana小团队也能做出“大团队级”的系列视觉物料;创意迭代快,提案阶段就能交付视觉概念。
Nano Banana虽强大,但不能完全替代摄影——细节仍需人工修,稳定性和速度也可能让人抓狂。
本文出自:智上,内容为作者独立观点,转载请在文章开头和结尾显眼处标注:出处和链接。不按规范转载侵权必究。