這是Google AI Studio 多模態挑戰賽的參賽作品
我建立了Chroma Canvas ,您的個人人工智慧藝術工作室。
Chroma Canvas 的核心設計旨在解決一個普遍存在的問題:空白畫布。它適合所有曾經迸發創意火花卻不知從何入手的人,也適合那些以更具藝術性的眼光看待世界的人。
它不僅僅是一個應用程式;它是一個將現實世界與您最瘋狂的想像融合在一起的創意夥伴。
Chroma Canvas 有兩種不同的模式:
🎨畫一個地方
此模式將整個地球變成您的畫布。您可以輸入任何地址,然後 Chroma Canvas 會利用 Google 地圖衛星圖像將該真實位置轉化為精美的藝術作品。您獲得的不僅僅是一張經過濾鏡處理的照片;您還可以獲得水彩、油畫、素描、蒸氣龐克等風格的獨特創作。
✨想像一個場景
在這裡,你的想像將自由馳騁。這款由 Imagen 提供支援的文字轉圖像模式,讓你能夠描述任何場景、概念或夢境,並以令人驚嘆的細節將其栩栩如生地呈現。從“雨中的賽博龐克城市”到“寧靜的生物發光森林”,唯一的限制在於你的輸入內容。
但這還不止於此!我還內建了一套人工智慧工具,讓體驗真正具有互動性:
🪄 魔法編輯:使用簡單的文字提示編輯您的創作。
🧐 人工智慧評論家 Vincent:對您的藝術進行詼諧的評論。
🎨 Palette Prodigy:從您的傑作中提取主色調。
💡 AI 位置天才:了解您所繪畫的地方的有趣事實。
您可以在這裡嘗試 Chroma Canvas:
以下是您可以執行的操作:
這是烏代浦令人驚嘆的薩詹加爾宮。左邊是Google地圖的衛星圖,右邊是人工智慧生成的神奇水彩畫。
我以「一隻雄偉的生物發光水母漂浮在星雲中,電影般、細緻」為靈感開啟了「想像一個場景」模式,並獲得了令人難以置信的效果。
這是一段展示「魔法編輯」功能的短片。我截取了原圖,並簡單地輸入了「新增一條在天空中飛翔的龍」的指令。結果流暢自然,令人眼前一亮。
(影片佔位符顯示原始藝術作品、用戶輸入編輯提示以及藝術作品重新生成,其中一條雄偉的巨龍翱翔在雲端。)
Google AI Studio 是 Chroma Canvas 所有核心功能背後的創意引擎。我利用一套強大的多模態模型,打造了無縫接軌且功能豐富的體驗。
gemini-2.5-flash-image-preview
(Nano Banana) :這是「畫出地點」和「魔法編輯」功能的亮點。它能夠將輸入影像(例如地圖截圖)與文字提示一起拍攝,這是該應用「藝術轉換」魔法的核心。
imagen-4.0-generate-001
:此模型是「想像場景」模式背後的強大引擎,將純文字描述轉化為高品質、富有想像的視覺效果。
gemini-2.5-flash
:這款多功能機型是所有「智慧型」文字和分析功能的主力。我用它做了以下工作:
- Generating witty art critiques.
- Providing interesting descriptions of real-world locations.
- Suggesting famous landmarks to inspire users.
- And, most impressively, analyzing an image to extract a color palette and return it in a structured **JSON format**, thanks to the `responseSchema` feature.
Chroma Canvas 的真正力量來自於其對多模式 AI 的深度整合,創造出超越各部分簡單總和的體驗。
該應用程式在圖像和文字之間建立了持續、流暢的對話,我相信這是創意工具的未來。
多模式功能如何增強使用者體驗:
- **What it is:** In "Paint a Place," the app takes a satellite *image* and a *text* prompt (the art style) to generate a completely new *image*.
- **Why it's great:** It’s a magical experience. It transforms a literal, data-rich map view into an emotional, artistic interpretation. It empowers users to see their own home, or any place on Earth, through the eyes of an artist.
- **What it is:** The "Magic Edit" feature allows users to refine a generated *image* using simple *text* commands.
- **Why it's great:** This turns the creative process from a one-shot command into an interactive conversation. Users don't have to be prompt engineering experts; they can iteratively build on their creation, making changes as naturally as if they were speaking to a fellow artist.
- **What it is:** The "Palette Prodigy" feature takes an *image* and asks the model to output structured **JSON** data representing the color palette.
- **Why it's great:** This is a fantastic example of multimodal understanding. The AI isn't just "seeing" the image; it's analyzing it and converting its visual properties into useful, tangible data. This is incredibly valuable for artists and designers looking for inspiration.
- **What it is:** "Vincent, the AI Critic" looks at a generated *image* and writes a short, witty critique in *text*.
- **Why it's great:** This adds a delightful, interactive layer that brings the user's creation to life. It makes the AI feel less like a tool and more like a quirky, creative partner, making the experience more memorable and fun.
透過將這些不同的多模式功能結合在一起,Chroma Canvas 旨在成為任何想要釋放創造力的人的真正直觀且強大的合作夥伴。