小編精選 - 技術文章翻譯 · 06月07日

【圖解】將工程師的「隨手畫的 Mermaid」轉換成能打動商業端的圖解

前言

（30 秒讀懂結論）

用 Mermaid 只寫結構 → 丟給專門做「資訊圖表化」的 Gem → 就會回傳白底、日文字體為哥德體的商務圖解
關鍵在於 不要一開始就丟長文。先用 Mermaid 固定結構，再讓它幫你清稿
如果想把日文文字和官方圖示漂亮地呈現出來，Nano Banana 建議選「Pro」或「2」

這篇文章的目標讀者是這些人。

會快速畫架構圖或流程圖，但要整理成簡報用圖就會覺得很麻煩的工程師

開會時常被交代「這個機制之後幫我畫成圖分享一下」的人

想了解 Gemini 圖像生成（Nano Banana）在工作上可以怎麼用的人

你是不是也曾經在工程師看得懂的圖和商務簡報用的圖之間，每次都花很多時間手動重畫、整理？

所以我做了一個 Gem：只要把 Mermaid 直接丟進去，它就會幫你清稿成「白底、日文字型為哥德體、帶官方圖示」的資訊圖表。提示詞只有 4 句。以下全文直接附上。

機制：為什麼要特地先經過 Mermaid

一開始我也是直接把想畫成圖的內容，用文章形式丟給 Nano Banana。但效果其實不太好。只要給它長篇說明，模型就會自作主張地把內容「這邊不重要吧」然後摘要掉，導致關鍵元素和箭頭方向跑掉。

這時候 Mermaid 就很有用。Mermaid 可以當作嚴格描述元素與關係的「結構中介語言」。先把結構固定好，Nano Banana 要做的就只剩清稿。這就是分工的概念。

腦中的模糊想法
   ↓ 結構化（人類 + Mermaid）
Mermaid（骨架、關係已確定）
   ↓ 清稿（Nano Banana）
資訊圖表（外觀整理完成）

把 Mermaid 想成設計者腦中的構想，Nano Banana 想成負責清稿的設計師——這樣分工就很清楚了。結構設計的責任由我們承擔，外觀呈現交給對方。先由人類把最容易失真的「摘要」步驟做完，這就是訣竅。

系統提示詞（全文公開）

只要把這段貼到 Gem 的自訂指示裡就行了。

gem-custom-instruction.txt

將輸入內容摘要並結構化，以日文哥德體生成資訊圖表圖片。請使用官方圖示進行視覺化。若輸入內容超過 30 個字，請先摘要並結構化，再進行圖片生成。背景為白色，不要標題。

雖然短，但每一句都有作用。依序來看：

「將輸入內容摘要並結構化」——不管是 Mermaid 還是長文，先轉成結構再畫。這是讓雜亂輸入也不容易崩壞的基礎
「以日文哥德體」——如果跑成明體或可愛字體，會很不符合簡報風格。這裡是往商務文件的標準靠攏
「請使用官方圖示進行視覺化」——指定要用 AWS 或各服務的官方圖示。不過後面會提到，這裡不要期待過高
「若輸入內容超過 30 個字」——防止你一不小心貼了長文。這裡也一樣先做摘要→結構化
「背景為白色，不要標題」——為了貼到簡報或 Slack 時不突兀。標題我想自己加，所以不讓它處理

這不是那種看起來很厲害的提示詞，但能穩定回傳相同品質，這點其實很有用。

模型選擇一定要注意（Nano Banana / Pro / 2）

這裡要補充一下，因為 2026 年上半年情況已經變了。「Nano Banana」現在已經不是單一模型。

通稱模型適合用途Nano BananaGemini 2.5 Flash Image高速、輕量。日文文字容易崩壞Nano Banana ProGemini 3 Pro Image資訊圖表、圖解、多語文字Nano Banana 2Gemini 3.1 Flash Image以 Flash 的速度達到接近 Pro 的品質這次的用途重點是「日文字能讀」以及「圖表不能破圖」。初代（2.5 Flash Image）很容易把日文弄壞，所以我現在都用 Pro 或 2。Google 也把 Nano Banana Pro 定位為適合用來視覺化點子、將資料做成資訊圖表、把手寫筆記圖解化的工具。這正好就是我想做的事。

Gem 內是否能生成圖片，以及可選的模型（Fast / Thinking / Pro），會依照方案與釋出狀況而有所不同。本文資訊以 2026 年 6 月為準。最新支援情況請以官方說明為準。

使用方法只有 3 步

用 Mermaid 寫出你想圖解的內容（照平常做就好）
把那段 Mermaid 貼到設定好上面提示詞的 Gem 裡送出
直接把回傳的圖片貼到簡報、Slack 或會議記錄裡

就這樣而已。我現在只是把在 VS Code 裡寫好的 Mermaid 複製貼上，幾乎不用再花時間清稿。老實說，第一次試的時候，我還有點「這樣真的可以嗎」的錯愕感。

實例 3 個：Mermaid → Nano Banana

「那最後到底會出現什麼圖？」應該是大家最在意的部分。我用三種風格差很多的圖試過。每個例子都是上方為 Qiita 直接渲染的 Mermaid（= 前），下方為丟進 Gem 後的輸出（= 後）。

後面的圖片請換成你自己用 Gem 生成的版本。只要把 ![...](圖片URL) 的 URL 部分替換成生成圖片連結即可。

例 1：AWS 構成圖（3 層 Web 應用）

前（Mermaid）:

後（Nano Banana）:

原本只有箭頭的架構，變成有圖示之後，一眼就能看出「請求從哪裡來、資料會存到哪裡」。

例 2：資料分析基盤的管線

前（Mermaid）:

後（Nano Banana）:

當你要向非工程師說明「資料從哪裡來、怎麼加工、最後誰會看」，這種清稿版非常有用。我的本業是 ID-POS 分析基盤，這個層級的圖最容易讓人理解。

例 3：業務流程（序列圖）

前（Mermaid）:

後（Nano Banana）:

時序性的互動，如果只看序列圖，讀的人通常需要一些預備知識。清稿之後，就會變成「送出申請後，完成付款，然後收到信」這種直覺流程。要交給商務端看，這種版本更適合。

踩雷的地方

雖然好用，但並不是萬能。我實際遇到的 3 個問題也記一下。

第一個是 不要對官方圖示的精確度期待過高。即使指示「使用官方圖示」，也不代表會出現像素級正確的 AWS 圖示，有時候只會生成外觀相近的圖示。若是對外文件，且必須完全符合品牌規範，這部分最好預設之後手動替換。

第二個是日文文字容易壞。前面提過，初代模型有時會出現像亂碼一樣的狀況。我之前就在這裡卡過一次，花了不少時間才發現問題不是提示詞，而是模型選擇（也就是根本原因在模型端）。切到 Pro 或 2 之後就解決了。

第三個是輸入太複雜的時候。如果一次把有 20 到 30 個節點的 Mermaid 整段丟進去，摘要階段可能會把部分元素刪掉。圖很大時，建議改成以子圖（subgraph）單位切開丟，這樣比較不容易崩。

把機密架構圖或系統資訊輸入雲端生成式 AI 時，務必先確認公司內部的資料處理政策。具體的主機名稱、IP、驗證資訊等，最好先改成假資料再送出。

總結

先用 Mermaid 固定結構，再交給 Nano Banana 清稿，幾乎可以消除商務圖解的手工整理成本
提示詞只有 4 句，直接複製貼到 Gem 就能用
想要日文與圖解品質，模型請選 Pro 或 2
官方圖示的嚴格精準度，以及機密資訊處理，這兩點要特別注意

老實說，我沒想到清稿這件事可以這麼輕鬆外包出去。跟我一樣「Mermaid 會畫，但整理成簡報很麻煩」的人，不妨試著做一個這樣的 Gem。若你有更好的提示詞改良方案，也歡迎留言告訴我。接下來我想寫的是，把這個 Gem 跟排程執行結合，讓定期簡報自動更新的做法。

原文出處：https://qiita.com/ktdatascience/items/4b35eb4e157becfac073

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

0個讚 0留言 650瀏覽

共有 0 則留言

登入之後發表留言

文字內容提供幾種功能：
1) --- 會變成分隔線（上一行必須是空白）
2) # 會變成一級標題
3) ## 會變成二級標題
4) ### 會變成三級標題
5) **粗體文字**會顯示粗體文字
6) ```當第一行與最後一行會顯示程式碼
7) 請搜尋 Markdown 語法，了解各種格式

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

🏆 本月排行榜

🥇

站長阿川

📝8 💬2 ❤️5

244

🥈

我愛JS

📝2 💬6 ❤️3

111

評分標準：發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10

本數據每小時更新一次