Nano-Banana Pro相較於前幾代產品實現了重大飛躍,從「娛樂性」圖像生成躍升至「功能性」專業資產製作。它在文字渲染、字元一致性、視覺合成、世界知識(搜尋)和高解析度 (4K) 輸出方面表現卓越。
本指南遵循有關如何開始使用AI Studio和 API 的開發者指南,涵蓋了核心功能以及如何有效地提示這些功能。
本文內容包括:
Nano-Banana Pro 是一款「思考型」模型。它不只是匹配關鍵字,還能理解意圖、物理原理和構圖。為了獲得最佳效果,請停止使用「標籤大雜燴」(例如: dog, park, 4k, realistic ),並像創意總監一樣進行創作。
1. 編輯,不要重新擲骰
該模型非常擅長理解對話式修改。如果圖片已有 80% 的正確度,就不要從頭開始產生新圖。只需提出您需要的具體修改即可。
2. 使用自然語言和完整句子
與模型交流時,要像指導藝術家創作一樣。使用正確的語法和描述性的形容詞。
❌差評: “酷車,霓虹燈,城市,夜晚,8k。”
✅好: “一個極具電影感的廣角鏡頭,展現了一輛未來主義跑車在雨夜的東京街道上疾馳。霓虹燈的光芒倒映在濕漉漉的路面和汽車的金屬底盤上。”
3. 要具體、描述清楚
模糊的提示只會得到千篇一律的結果。要明確主題、場景、光線和氛圍。
主題:不要用“一位女士”,而要用“一位穿著復古香奈兒風格套裝的優雅老婦人”。
材質:描述質感。 「霧面」、「拉絲鋼」、「柔軟天鵝絨」、「皺紙」。
4. 提供背景資訊(「為什麼」或「為誰而做」)
因為模型會“思考”,所以給它背景資訊有助於它做出合乎邏輯的藝術決定。
Nano-Banana Pro 具備最先進的功能,能夠渲染出清晰易讀、風格化的文本,並將複雜的資訊合成為視覺格式。
最佳實踐:
壓縮:要求模型將密集的文字或 PDF “壓縮”成視覺輔助材料。
風格:請指定您想要「精緻的社論風格」、「技術圖表風格」或「手繪白板風格」。
引用:請明確指定您要用引號括起來的文字。
範例提示:
獲利報告資訊圖表(資料導入):
[輸入Google最新財報的PDF檔]
“製作一份簡潔現代的訊息圖,概括這份盈利報告的關鍵財務亮點。圖表應包含‘盈利增長’和‘淨利潤’,並在風格化的引言框中突出顯示首席執行官的關鍵語錄。”
請在 AI Studio 中嘗試(注意:需要上傳 PDF 文件)
復古資訊圖:
“製作一張復古的、20世紀50年代風格的訊息圖,介紹美國餐館的歷史。訊息圖應包含‘食物’、‘點唱機’和‘裝飾’等不同部分。確保所有文字清晰易讀,並符合當時的風格。”
技術圖:
“繪製一份正投影藍圖,以平面圖、立面圖和剖面圖的形式描述該建築。用專業建築字體清晰標註‘北立面’和‘正門’。格式為16:9。”
白板總結(教育):
請用手繪白板圖的形式概括「Transformer神經網路架構」的概念,使其適用於大學講座。編碼器和解碼器模組請使用不同顏色的馬克筆,並清楚標示「自註意力」和「前饋」。

Nano-Banana Pro支援最多 14 張參考影像(其中 6 張為高保真影像)。這使得「身份鎖定」功能成為可能——可以將特定人物或角色置於新的場景中,而不會造成臉部變形。
最佳實踐:
身份鎖定:明確說明:“保持人物面部特徵與圖像 1 完全相同。”
表情/動作:描述在保持身分的同時,情緒或姿勢的變化。
病毒式構圖:將主題與醒目的圖形和文字一次結合。
範例提示:
「病毒式傳播縮圖」(辨識 + 文字 + 圖形):
「使用圖1中的人物設計一個病毒式傳播的影片縮圖。面部一致性:保持人物面部特徵與圖1完全相同,但改變其表情,使其看起來興奮和驚訝。動作:將人物置於畫面左側,手指指向畫面右側。主體:在畫面右側放置一張美味的牛油果吐司高清圖片。圖形:加入一個醒醒黃色箭頭,連接人物的手指和文字加醒文字」(3分鐘搞定!)。使用粗白線描邊並加入陰影。背景:模糊明亮的廚房背景。高飽和度和高對比度。”
在 AI Studio 中嘗試(注意:需要上傳參考圖像)
「毛茸茸的朋友」情景(團體一致性):
[輸入3張不同絨毛玩具的圖片]
請創作一個有趣的十頁故事,講述這三個毛茸茸的小夥伴去熱帶度假的故事。故事情節跌宕起伏,扣人心弦,最終以溫馨的結局結束。三個角色的服裝和形像要保持一致,但他們的表情和角度在十幅圖中要有所變化。每幅圖中每個角色只能出現一次。
在 AI Studio 中嘗試(注意:需要上傳參考圖像)
品牌資產創造:
[輸入一張產品圖片]
「請創作9張精美的時尚大片,風格應如同獲獎時尚雜誌大片。請以此為品牌風格參考,但需在風格上進行細微調整和豐富變化,以展現專業設計感。請一次創作一張,共創作九張圖片。”
在 AI Studio 中嘗試(注意:需要上傳參考圖像)
Nano-Banana Pro 使用 Google 搜尋根據即時資料、時事或事實驗證生成圖像,從而減少對時事話題的幻覺。
最佳實踐:
要求提供動態資料(天氣、股票、新聞)的視覺化圖表。
該模型會在生成圖像之前對搜尋結果進行「思考」(推理)。
範例提示:
即時資料視覺化:
“將主要科技公司的當前股價和股價走勢可視化。針對每家公司,解釋近期發生的哪些事件可以解釋其股價走勢。”
事件視覺化:
“根據當前的旅遊趨勢,製作一張資訊圖,展示2025年遊覽美國國家公園的最佳時間。”
該模型擅長透過對話提示進行複雜的編輯。這包括“圖像修復”(移除/加入物件)、“修復”(修復舊照片)、“著色”(漫畫/黑白照片)和“風格互換”。
最佳實踐:
語意指令:無需手動遮罩;只需告訴模型要自然地改變什麼即可。
物理理解:您可以要求進行複雜的更改,例如“將這個杯子裝滿液體”,以測試物理生成。
範例提示:
物件移除與補繪:
“將照片背景中的遊客移除,並用與周圍環境相協調的合理紋理(鵝卵石和店面)填充空間。”
在 AI Studio 中嘗試一下(注意:需要上傳照片)
漫畫/漫畫著色:
[輸入黑白漫畫畫面]
“給這幅漫畫分鏡上色。使用鮮豔的動漫風格配色方案。確保能量光束的照明效果呈現霓虹藍色,並且角色的服裝顏色與其官方配色一致。”
在 AI Studio 中嘗試(注意:需要上傳圖片)
在地化(文字翻譯+文化適應):
[插入一張倫敦公車站廣告的圖片]
“將這個概念本地化到東京背景,包括將標語翻譯成日語。將背景改為夜晚熙熙攘攘的澀谷街道。”

在 AI Studio 中嘗試(注意:需要上傳圖片)
照明/季節控制:
[輸入一張夏季房屋的圖片]
「把這個場景變成冬天。保持房屋建築風格不變,但在屋頂和院子裡加上積雪,並將光線改為寒冷陰沉的午後。”

在 AI Studio 中嘗試(注意:需要上傳圖片)
一項強大的新功能是將二維示意圖轉換為三維視覺化影像,反之亦然。這對於室內設計師、建築師和表情包創作者來說都非常理想。
範例提示:
2D平面圖轉3D室內設計圖:
「根據上傳的二維平面圖,產生一張專業的室內設計展示圖。佈局:採用拼貼畫形式,頂部為一張大型主圖(客廳廣角視圖),下方為三張較小圖片(主臥、家庭辦公室和三維俯視圖)。風格:所有圖片均採用現代簡約風格,搭配溫暖的橡木地板和米白色牆面。質量:照片」,柔和的自然光級。」
請在 AI Studio 中嘗試(注意:需要上傳平面圖)
2D 轉 3D 表情包:
“把‘一切都好’狗狗表情包做成逼真的3D渲染圖。保持構圖不變,但讓狗狗看起來像毛絨玩具,火焰看起來像真實的火焰。”
Nano-Banana Pro 支援原生 1K 至 4K 影像生成。這對於處理精細紋理或製作大幅面列印作品尤其有用。
最佳實踐:
如果您的 API/介面允許,請明確要求高解析度(2K 或 4K)。
描述高保真細節(瑕疵、表面紋理)。
範例提示:
4K紋理生成:
“利用原生高保真輸出,打造令人嘆為觀止、充滿氛圍的苔蘚森林地面環境。掌控複雜的光照效果和細膩的紋理,確保每一根苔蘚和每一束光線都以像素級分辨率渲染,滿足 4K 壁紙的要求。”

複雜邏輯(思維模式):
“製作一張超逼真的美食起司漢堡資訊圖,將其拆解,展現烤過的奶油蛋捲麵包的質地、肉餅煎至焦香的外皮以及閃閃發光的融化起司。並為每一層標註其風味特徵。”

Nano-Banana Pro 預設採用「思考」模式,它會產生一些中間的思考圖像(不計費),以便在渲染最終輸出之前優化構圖。這有助於進行資料分析和解決視覺問題。
範例提示:
解方程式:
“請在白板上用 C 語言解方程組 log_{x^2+1}(x^4-1)=2。請清楚寫出解題步驟。”
視覺推理:
“分析這張房間圖片,產生一張‘之前’的圖片,展示房間在施工期間可能的樣子,包括框架和未完成的石膏板。”
在 AI Studio 中嘗試(注意:需要上傳圖片)
您無需網格即可產生連續的藝術圖或故事板,從而確保在一次操作中實現連貫的敘事流程。這種方法也常用於「電影概念藝術」(例如,即將上映電影的虛假洩漏圖)。
範例提示:
請創作一個引人入勝的九部分故事,包含九張圖片,故事中需出現一位女性和一位男性,他們正在拍攝一部屢獲殊榮的豪華行李箱廣告。故事應有起伏的情感,最後以一位女性手持品牌標誌的優雅照片結尾。男女主角的身份和服裝必須保持一致,但可以從不同的角度和距離拍攝。請逐一產生圖片。請確保每張圖片均為16:9橫向格式。
輸入影像不僅限於角色參考或待編輯物件。您可以使用它們來嚴格控制最終輸出的構圖和佈局。對於需要將草圖、線框圖或特定網格佈局轉化為精美素材的設計師來說,這無疑是一項顛覆性的創新。
最佳實踐:
草稿和草圖:上傳手繪草圖,以準確定義文字和物件的位置。
線框圖:使用現有佈局或線框圖的螢幕截圖來產生高保真 UI 模型。
網格:使用網格影像強制模型產生基於圖塊的遊戲或 LED 顯示器的資源。
範例提示:
從草圖到最終廣告:
請根據這張草圖為[產品]創作一則廣告。
在 AI Studio 中嘗試一下(注意:需要上傳草圖)
根據線框圖建立使用者介面模型:
“請按照以下準則建立一個[產品]模型。”
在 AI Studio 中嘗試一下(注意:需要上傳線框圖)
像素藝術與LED顯示器:
“請繪製一個獨角獸像素畫,使其完美契合這幅 64x64 的網格圖像。使用高對比度的顏色。”
(提示:開發人員隨後可以透過程式設計方式提取每個單元格的中心顏色,以驅動連接的 64x64 LED 點陣顯示器)。
在 AI Studio 中嘗試一下(注意:需要上傳網格圖像)
精靈:
“一位女性在無人機上做後空翻的精靈圖,3x3網格,逐幀動畫序列,正方形寬高比。請完全按照附件參考圖像的結構進行繪製。”
(提示:您可以提取每個單元格並製作成 GIF 動畫)


既然你已經掌握了提示的基本技巧,接下來就可以開始建立了:
在使用者介面中進行實驗: Google AI Studio是測試提示和參數的最快方法。
在應用程式商店裡查看這款由奈米香蕉驅動的超酷應用。
Vibe-code 你夢想中的應用:將你最好的提示轉化為一個應用,你可以輕鬆地在AI Studio Build中與你的朋友分享。
建立應用程式:準備好編寫程式碼了嗎?請查看開發者指南或Gemini API Cookbook ,以取得指南和程式碼片段。
技術深度解析:請閱讀完整的Gemini API 文件,以了解有關速率限制、定價和整合的詳細資訊。

原文出處:https://dev.to/googleai/nano-banana-pro-prompting-guide-strategies-1h9n