(30 秒讀懂結論)
這篇文章的目標讀者是這些人。
- 會快速畫架構圖或流程圖,但要整理成簡報用圖就會覺得很麻煩的工程師
- 開會時常被交代「這個機制之後幫我畫成圖分享一下」的人
- 想了解 Gemini 圖像生成(Nano Banana)在工作上可以怎麼用的人
你是不是也曾經在工程師看得懂的圖和商務簡報用的圖之間,每次都花很多時間手動重畫、整理?
所以我做了一個 Gem:只要把 Mermaid 直接丟進去,它就會幫你清稿成「白底、日文字型為哥德體、帶官方圖示」的資訊圖表。提示詞只有 4 句。以下全文直接附上。
一開始我也是直接把想畫成圖的內容,用文章形式丟給 Nano Banana。但效果其實不太好。只要給它長篇說明,模型就會自作主張地把內容「這邊不重要吧」然後摘要掉,導致關鍵元素和箭頭方向跑掉。
這時候 Mermaid 就很有用。Mermaid 可以當作嚴格描述元素與關係的「結構中介語言」。先把結構固定好,Nano Banana 要做的就只剩清稿。這就是分工的概念。
腦中的模糊想法
↓ 結構化(人類 + Mermaid)
Mermaid(骨架、關係已確定)
↓ 清稿(Nano Banana)
資訊圖表(外觀整理完成)
把 Mermaid 想成設計者腦中的構想,Nano Banana 想成負責清稿的設計師——這樣分工就很清楚了。結構設計的責任由我們承擔,外觀呈現交給對方。先由人類把最容易失真的「摘要」步驟做完,這就是訣竅。
只要把這段貼到 Gem 的自訂指示裡就行了。
gem-custom-instruction.txt
將輸入內容摘要並結構化,以日文哥德體生成資訊圖表圖片。請使用官方圖示進行視覺化。若輸入內容超過 30 個字,請先摘要並結構化,再進行圖片生成。背景為白色,不要標題。
雖然短,但每一句都有作用。依序來看:
這不是那種看起來很厲害的提示詞,但能穩定回傳相同品質,這點其實很有用。
這裡要補充一下,因為 2026 年上半年情況已經變了。「Nano Banana」現在已經不是單一模型。
通稱模型適合用途Nano BananaGemini 2.5 Flash Image高速、輕量。日文文字容易崩壞Nano Banana ProGemini 3 Pro Image資訊圖表、圖解、多語文字Nano Banana 2Gemini 3.1 Flash Image以 Flash 的速度達到接近 Pro 的品質這次的用途重點是「日文字能讀」以及「圖表不能破圖」。初代(2.5 Flash Image)很容易把日文弄壞,所以我現在都用 Pro 或 2。Google 也把 Nano Banana Pro 定位為適合用來視覺化點子、將資料做成資訊圖表、把手寫筆記圖解化的工具。這正好就是我想做的事。
Gem 內是否能生成圖片,以及可選的模型(Fast / Thinking / Pro),會依照方案與釋出狀況而有所不同。本文資訊以 2026 年 6 月為準。最新支援情況請以官方說明為準。
就這樣而已。我現在只是把在 VS Code 裡寫好的 Mermaid 複製貼上,幾乎不用再花時間清稿。老實說,第一次試的時候,我還有點「這樣真的可以嗎」的錯愕感。
「那最後到底會出現什麼圖?」應該是大家最在意的部分。我用三種風格差很多的圖試過。每個例子都是上方為 Qiita 直接渲染的 Mermaid(= 前),下方為丟進 Gem 後的輸出(= 後)。
後面的圖片請換成你自己用 Gem 生成的版本。只要把  的 URL 部分替換成生成圖片連結即可。
前(Mermaid):
後(Nano Banana):

原本只有箭頭的架構,變成有圖示之後,一眼就能看出「請求從哪裡來、資料會存到哪裡」。
前(Mermaid):
後(Nano Banana):

當你要向非工程師說明「資料從哪裡來、怎麼加工、最後誰會看」,這種清稿版非常有用。我的本業是 ID-POS 分析基盤,這個層級的圖最容易讓人理解。
前(Mermaid):
後(Nano Banana):

時序性的互動,如果只看序列圖,讀的人通常需要一些預備知識。清稿之後,就會變成「送出申請後,完成付款,然後收到信」這種直覺流程。要交給商務端看,這種版本更適合。
雖然好用,但並不是萬能。我實際遇到的 3 個問題也記一下。
第一個是 不要對官方圖示的精確度期待過高。即使指示「使用官方圖示」,也不代表會出現像素級正確的 AWS 圖示,有時候只會生成外觀相近的圖示。若是對外文件,且必須完全符合品牌規範,這部分最好預設之後手動替換。
第二個是日文文字容易壞。前面提過,初代模型有時會出現像亂碼一樣的狀況。我之前就在這裡卡過一次,花了不少時間才發現問題不是提示詞,而是模型選擇(也就是根本原因在模型端)。切到 Pro 或 2 之後就解決了。
第三個是輸入太複雜的時候。如果一次把有 20 到 30 個節點的 Mermaid 整段丟進去,摘要階段可能會把部分元素刪掉。圖很大時,建議改成以子圖(subgraph)單位切開丟,這樣比較不容易崩。
把機密架構圖或系統資訊輸入雲端生成式 AI 時,務必先確認公司內部的資料處理政策。具體的主機名稱、IP、驗證資訊等,最好先改成假資料再送出。
老實說,我沒想到清稿這件事可以這麼輕鬆外包出去。跟我一樣「Mermaid 會畫,但整理成簡報很麻煩」的人,不妨試著做一個這樣的 Gem。若你有更好的提示詞改良方案,也歡迎留言告訴我。接下來我想寫的是,把這個 Gem 跟排程執行結合,讓定期簡報自動更新的做法。
原文出處:https://qiita.com/ktdatascience/items/4b35eb4e157becfac073