這是Google AI Studio 多模態挑戰賽的參賽作品

我建造了什麼

我建立了Artisan Social ,它是您集思廣益打造社交媒體應用程式的個人 AI 設計夥伴!

您是否曾經有過一個絕妙的新應用程式創意,但卻苦於無法將其具體化? Artisan Social 可以幫您實現。這是一家創意工作室,致力於將簡單的文字創意轉化為令人驚艷、切實可行的設計概念。

魔法就在這裡:

  1. 你可以從一個火花開始——一個簡單的想法,例如「城市園丁的社交網絡」。

  2. 我們的人工智慧由 Gemini 提供支持,為您集思廣益,提出十個獨特的設計角度。

  3. 然後,它透過產生高品質的視覺表現形式使每個概念栩栩如生。

  4. 最後,您可以使用簡單的文字命令深入研究並反覆編輯任何設計,真正使其成為您自己的設計。

Artisan Social 旨在打破創造力障礙並加速從想像到視覺化的旅程。

示範

您可以在這裡找到該小程式的現場演示:

已部署小程式的連結

以下是該體驗的簡介:

第一步:靈感迸發

用戶將他們的社交應用程式概念輸入到一個乾淨、吸引人的介面中。

影像描述

第二步:人工智慧驅動的構思

片刻之後,該應用程式會顯示由人工智慧產生的十個不同的視覺概念的圖庫,每個概念都有獨特的名稱和描述。

影像描述

影像描述

步驟 3:多模式編輯器

使用者選擇一個設計並進入編輯器。透過提供諸如「將配色方案更改為帶有霓虹綠色點綴的暗色模式」之類的文字提示,他們可以立即看到自己的構想在新的編輯圖像中栩栩如生地呈現。

影像描述

影像描述

我該如何使用 Google AI Studio

Google AI Studio 和 Gemini 模型是 Artisan Social 的核心和靈魂。我使用@google/genai SDK 編排了三個強大的模型,每個模型都發揮著各自的作用。

  • gemini-2.5-flash用於結構化腦力激盪
I used this model for the initial ideation phase. The goal wasn't just to get text, but to get *structured data*. By defining a `responseSchema`, I instructed Gemini to return a clean JSON array of design ideas, each with a `name`, `description`, and a `visual_prompt`. This makes the output reliable and easy to parse, avoiding messy string manipulation.
  • imagen-4.0-generate-001用於視覺創作
This is the artist. It takes the detailed `visual_prompt` generated by `gemini-2.5-flash` and transforms it into a beautiful, high-resolution concept image. The results are vibrant, professional, and truly capture the essence of the idea.
  • gemini-2.5-flash-image-preview用於多模式魔法
This is where the true collaboration happens. This model's ability to understand both an *image* and a *text* prompt simultaneously is the core of the editing feature. It's not just applying a filter; it's comprehending a visual context and a linguistic instruction to create something entirely new.

多模態特徵

該節目的明星是AI 設計編輯器,這是一款強大的多模式工具,讓視覺編輯感覺就像一場對話。

此功能可同時接受兩種不同類型的輸入(或模式):

  1. 圖像:使用者想要調整的現有設計概念。

  2. 文字:描述所需變更的自然語言命令。

最終呈現出一個無縫、迭代的工作流程。使用者無需為了做出細微的改變而編寫一個全新的、複雜的提示,只需對已有內容進行最佳化即可。

每次修改都聘請一位新藝術家與與一位記得上次談話的藝術家合作之間是有區別的。

這從根本上增強了使用者體驗,因為它使創作過程:

  • 更快:小調整隻需幾秒鐘,而不是幾分鐘。

  • 更直觀:使用者可以自然地表達變化,而無需學習複雜的「即時工程」術語。

  • 更具創意:它鼓勵用戶進行實驗。當嘗試新想法的成本只是輸入一個句子時,使用者更有可能探索各種天馬行空、精彩的變化。

透過結合圖像和文字理解,Artisan Social 將一個簡單的圖像生成器轉變為一個動態的互動式設計夥伴。


原文出處:https://dev.to/ha3k/artisan-social-a71


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝10   💬6   ❤️11
448
🥈
我愛JS
📝1   💬6   ❤️4
93
🥉
AppleLily
📝1   💬4   ❤️1
46
#4
💬2  
6
#5
💬1  
5
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次