這是Google AI Studio 多模態挑戰賽的參賽作品
Stylo AI 是一款基於網頁的多功能 AI 攝影工作室,能夠自動化並簡化虛擬時尚攝影流程。該應用程式支援用戶(包括設計師、攝影師和零售商)即時生成身著客製化服裝的模特兒逼真圖像,調整模特兒姿勢,並將主體置於 AI 生成的全新環境中。 Stylo AI 解決了手動拍攝耗時耗力且成本高昂的問題,讓任何人都能以先進的精準度、風格控制和高效的工作流程,創造出高品質的時尚視覺作品。
部署的小程式:https://ai.studio/apps/drive/1heo5X\_TOhsXa1fHtPX6F-t41QJGEHQ1u
截圖:
頭像建立(中性服裝修復)
試穿結果(模特兒穿著新衣服)
姿勢變化(模型處於自訂姿勢)
環境放置(新設定中的模型)
影片: https://drive.google.com/file/d/1blkhUIjTbAqToA6yRJYXTL11VWXXZloB/view?usp= sharing
Stylo AI 基於 Google AI Studio 建置,使用 @google/genai SDK 無縫存取 Gemini 的多模態圖像和文字生成功能。所有 AI 交互作用(包括影像合成、姿態變換和嚴格的輸出評估)均透過專用的 Gemini 服務層處理。主要使用的模型包括用於影像到影像任務的 gemini-2.5-flash-image-preview 模型和用於自我驗證和基於 JSON 的評估的 gemini-2.5-pro 模型,以確保產生輸出的最高保真度和準確性。
這是我第一次使用 Google AI Studio,它讓我大開眼界,作為一名經驗豐富的開發人員,我迫切地需要加入。我只需與 AI 助理對話,就能快速地建立原型並迭代不同的想法,效果令人印象深刻。這些快速建構的原型功能未來可能會被整合到我們公司某個更大型的產品中。
Stylo AI 使用以下工具實現先進的多模式工作流程:
頭像:使用使用者提供的影像進行精確修復,以標準化模型照片,從而進行虛擬試穿。
試穿:深度影像合成整合模型和服裝影像,並透過結構化 JSON 評分進行自動輸出驗證,以確保真實感和服裝保真度。
姿勢:透過配對參考草圖進行 AI 驅動的姿勢轉換,確保模型的身份、服裝和背景保留。
環境:AI 繪圖將模型置於新的主題環境中,根據靈感影像來搭配燈光和氛圍。
這些功能讓使用者可以操作影像、草圖和參考環境,提供時尚攝影的端到端控制,並顯著提高虛擬攝影的創作可能性、真實感和生產力。
感謝您給予我參與的機會!
原文出處:https://dev.to/ivalduan/stylo-ai-from-garment-digital-twin-to-reallife-photography-1m9l