本文是我提交給DEV 教育主題:使用 Google AI Studio 建立應用程式的參賽作品。
我發展了「寓言插畫家」(The Allegorical Illustrator)這個應用,它可以將抽象的哲學概念轉化為精美的寓言藝術作品。使用者可以選擇哲學難題(例如“忒修斯之船”)和藝術風格(例如“日本浮世繪”),該應用利用人工智慧生成獨特的視覺表現形式,並附上詳細的解釋。
這個應用是透過一系列提示逐步迭代開發的。最初的提示很簡單,就是根據一張描述性圖片來建立應用程式。之後,我透過對話式的請求加入了各種功能,例如:
“加入一個‘分享’按鈕……允許用戶將生成的圖像及其說明一起作為圖像分享。”
“增加一條護欄,首先驗證給定的概念是否確實代表一個哲學概念。”
“加入一項功能,用於顯示之前生成的寓言故事的歷史記錄……這些故事存儲在客戶端的 localStorage 中。”
這款應用程式的關鍵特性在於其多步驟、人工智慧驅動的生成和驗證流程,該流程針對不同的任務使用不同的模型。它首先驗證使用者輸入,然後產生詳細的圖像提示和哲學解釋,接著使用 Imagen 建立圖像,最後執行多模態檢查,以確保圖像與概念相符。
https://the-allegorical-illustrator-789616276303.us-west1.run.app/

參與這個計畫是一次令人著迷的AI驅動開發實踐。我最大的收穫是體會到,採用多步驟、「思考鏈」式的提示方法來處理複雜任務是多麼有效。與其試圖一次完成所有操作,不如將問題分解成一系列經過驗證的步驟——輸入驗證、內容生成、圖像建立和圖像驗證——這樣最終開發出的應用程式更加健壯可靠。
我深入了解如何充分利用不同模型的優勢。我使用功能強大的 gemini-2.5-pro 來處理解讀哲學和創作創意提示等細緻入微的任務,使用 imagen-4.0-generate-001 來處理解讀哲學和創作創意提示等細緻入微的任務,使用 imagen-4.0-generate-001 來生成高質量圖像,並使用快速的多模態 gemini-2.5-flash 來進行驗證步驟。強制模型使用 responseSchema 返回結構化的 JSON 資料是一項突破性進展,它使得 AI 與應用程式邏輯之間的整合變得無縫且無誤。
最令我驚訝的是,人工智慧竟然能如此有效地建構自身的安全防護機制。我讓人工智慧扮演「驗證專家」的角色來檢查使用者的輸入,之後又讓它扮演「藝術評論家」的角色來驗證自身的影像輸出,這讓我彷彿看到了建構安全、高品質人工智慧應用的未來。整個開發過程與其說是傳統的編碼,不如說更像是一次充滿創意的協作,引導著一位能力超群的助手將一個複雜的想法變成現實。
原文出處:https://dev.to/vns1311/the-allegorical-illustrator-30fk