前言

(30 秒讀懂結論)

  • 用 Mermaid 只寫結構 → 丟給專門做「資訊圖表化」的 Gem → 就會回傳白底、日文字體為哥德體的商務圖解
  • 關鍵在於 不要一開始就丟長文。先用 Mermaid 固定結構,再讓它幫你清稿
  • 如果想把日文文字和官方圖示漂亮地呈現出來,Nano Banana 建議選「Pro」或「2」

這篇文章的目標讀者是這些人。

  • 會快速畫架構圖或流程圖,但要整理成簡報用圖就會覺得很麻煩的工程師
  • 開會時常被交代「這個機制之後幫我畫成圖分享一下」的人
  • 想了解 Gemini 圖像生成(Nano Banana)在工作上可以怎麼用的人

你是不是也曾經在工程師看得懂的圖和商務簡報用的圖之間,每次都花很多時間手動重畫、整理?

所以我做了一個 Gem:只要把 Mermaid 直接丟進去,它就會幫你清稿成「白底、日文字型為哥德體、帶官方圖示」的資訊圖表。提示詞只有 4 句。以下全文直接附上。

機制:為什麼要特地先經過 Mermaid

一開始我也是直接把想畫成圖的內容,用文章形式丟給 Nano Banana。但效果其實不太好。只要給它長篇說明,模型就會自作主張地把內容「這邊不重要吧」然後摘要掉,導致關鍵元素和箭頭方向跑掉。

這時候 Mermaid 就很有用。Mermaid 可以當作嚴格描述元素與關係的「結構中介語言」。先把結構固定好,Nano Banana 要做的就只剩清稿。這就是分工的概念。

腦中的模糊想法
   ↓ 結構化(人類 + Mermaid)
Mermaid(骨架、關係已確定)
   ↓ 清稿(Nano Banana)
資訊圖表(外觀整理完成)

把 Mermaid 想成設計者腦中的構想,Nano Banana 想成負責清稿的設計師——這樣分工就很清楚了。結構設計的責任由我們承擔,外觀呈現交給對方。先由人類把最容易失真的「摘要」步驟做完,這就是訣竅。

系統提示詞(全文公開)

只要把這段貼到 Gem 的自訂指示裡就行了。

gem-custom-instruction.txt

將輸入內容摘要並結構化,以日文哥德體生成資訊圖表圖片。請使用官方圖示進行視覺化。若輸入內容超過 30 個字,請先摘要並結構化,再進行圖片生成。背景為白色,不要標題。

雖然短,但每一句都有作用。依序來看:

  • 「將輸入內容摘要並結構化」——不管是 Mermaid 還是長文,先轉成結構再畫。這是讓雜亂輸入也不容易崩壞的基礎
  • 「以日文哥德體」——如果跑成明體或可愛字體,會很不符合簡報風格。這裡是往商務文件的標準靠攏
  • 「請使用官方圖示進行視覺化」——指定要用 AWS 或各服務的官方圖示。不過後面會提到,這裡不要期待過高
  • 「若輸入內容超過 30 個字」——防止你一不小心貼了長文。這裡也一樣先做摘要→結構化
  • 「背景為白色,不要標題」——為了貼到簡報或 Slack 時不突兀。標題我想自己加,所以不讓它處理

這不是那種看起來很厲害的提示詞,但能穩定回傳相同品質,這點其實很有用。

模型選擇一定要注意(Nano Banana / Pro / 2)

這裡要補充一下,因為 2026 年上半年情況已經變了。「Nano Banana」現在已經不是單一模型。

通稱模型適合用途Nano BananaGemini 2.5 Flash Image高速、輕量。日文文字容易崩壞Nano Banana ProGemini 3 Pro Image資訊圖表、圖解、多語文字Nano Banana 2Gemini 3.1 Flash Image以 Flash 的速度達到接近 Pro 的品質這次的用途重點是「日文字能讀」以及「圖表不能破圖」。初代(2.5 Flash Image)很容易把日文弄壞,所以我現在都用 Pro 或 2。Google 也把 Nano Banana Pro 定位為適合用來視覺化點子、將資料做成資訊圖表、把手寫筆記圖解化的工具。這正好就是我想做的事。

Gem 內是否能生成圖片,以及可選的模型(Fast / Thinking / Pro),會依照方案與釋出狀況而有所不同。本文資訊以 2026 年 6 月為準。最新支援情況請以官方說明為準。

使用方法只有 3 步

  1. 用 Mermaid 寫出你想圖解的內容(照平常做就好)
  2. 把那段 Mermaid 貼到設定好上面提示詞的 Gem 裡送出
  3. 直接把回傳的圖片貼到簡報、Slack 或會議記錄裡

就這樣而已。我現在只是把在 VS Code 裡寫好的 Mermaid 複製貼上,幾乎不用再花時間清稿。老實說,第一次試的時候,我還有點「這樣真的可以嗎」的錯愕感。

實例 3 個:Mermaid → Nano Banana

「那最後到底會出現什麼圖?」應該是大家最在意的部分。我用三種風格差很多的圖試過。每個例子都是上方為 Qiita 直接渲染的 Mermaid(= 前),下方為丟進 Gem 後的輸出(= 後)。

後面的圖片請換成你自己用 Gem 生成的版本。只要把 ![...](圖片URL) 的 URL 部分替換成生成圖片連結即可。

例 1:AWS 構成圖(3 層 Web 應用)

前(Mermaid):

後(Nano Banana):
image.png

原本只有箭頭的架構,變成有圖示之後,一眼就能看出「請求從哪裡來、資料會存到哪裡」。

例 2:資料分析基盤的管線

前(Mermaid):

後(Nano Banana):

image.png

當你要向非工程師說明「資料從哪裡來、怎麼加工、最後誰會看」,這種清稿版非常有用。我的本業是 ID-POS 分析基盤,這個層級的圖最容易讓人理解。

例 3:業務流程(序列圖)

前(Mermaid):

後(Nano Banana):

image.png

時序性的互動,如果只看序列圖,讀的人通常需要一些預備知識。清稿之後,就會變成「送出申請後,完成付款,然後收到信」這種直覺流程。要交給商務端看,這種版本更適合。

踩雷的地方

雖然好用,但並不是萬能。我實際遇到的 3 個問題也記一下。

第一個是 不要對官方圖示的精確度期待過高。即使指示「使用官方圖示」,也不代表會出現像素級正確的 AWS 圖示,有時候只會生成外觀相近的圖示。若是對外文件,且必須完全符合品牌規範,這部分最好預設之後手動替換。

第二個是日文文字容易壞。前面提過,初代模型有時會出現像亂碼一樣的狀況。我之前就在這裡卡過一次,花了不少時間才發現問題不是提示詞,而是模型選擇(也就是根本原因在模型端)。切到 Pro 或 2 之後就解決了。

第三個是輸入太複雜的時候。如果一次把有 20 到 30 個節點的 Mermaid 整段丟進去,摘要階段可能會把部分元素刪掉。圖很大時,建議改成以子圖(subgraph)單位切開丟,這樣比較不容易崩。

把機密架構圖或系統資訊輸入雲端生成式 AI 時,務必先確認公司內部的資料處理政策。具體的主機名稱、IP、驗證資訊等,最好先改成假資料再送出。

總結

  • 先用 Mermaid 固定結構,再交給 Nano Banana 清稿,幾乎可以消除商務圖解的手工整理成本
  • 提示詞只有 4 句,直接複製貼到 Gem 就能用
  • 想要日文與圖解品質,模型請選 Pro 或 2
  • 官方圖示的嚴格精準度,以及機密資訊處理,這兩點要特別注意

老實說,我沒想到清稿這件事可以這麼輕鬆外包出去。跟我一樣「Mermaid 會畫,但整理成簡報很麻煩」的人,不妨試著做一個這樣的 Gem。若你有更好的提示詞改良方案,也歡迎留言告訴我。接下來我想寫的是,把這個 Gem 跟排程執行結合,讓定期簡報自動更新的做法。


原文出處:https://qiita.com/ktdatascience/items/4b35eb4e157becfac073


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝6   💬2   ❤️1
179
🥉
我愛JS
💬1  
3
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
📢 贊助商廣告 · 我要刊登