這是Google AI Studio 多模態挑戰賽的參賽作品
{% 嵌入 https://youtu.be/CHjAt40OoM4 %}
作為一個致力於讓設計民主化、讓每個人都能輕鬆規劃家居的人,我提交此作品的目的是展現Google AI Studio的變革力量,並展示其多模態 Gemini 功能如何徹底改變家居設計行業。 DreamNest.ai 是一個全面的 AI 驅動平台,能夠將簡單的用戶需求轉化為完整、可視化的家居設計方案,從而證明複雜的建築視覺化不再局限於昂貴的設計公司。
家居設計一直以來都是一個專屬且昂貴的過程,需要專業知識和專業技能。大多數人很難從簡單的平面圖上勾勒出自己夢想中的家,也無法有效地向建築師傳達自己的構想。我希望建立一個能夠打破這些障礙的平台——一個直觀易用的平台,任何人都可以輸入自己的需求,並立即獲得專業品質的設計資源,包括逼真的渲染圖、詳細的藍圖、沉浸式的視訊導覽和精心策劃的購物清單。
在探索Google AI Studio及其多模式模型時,我發現它們可以顯著簡化整個設計工作流程:
房屋正面圖
房屋內部景觀
{% 嵌入 https://youtu.be/AV-SXFrS\_I4 %}
🛍️ 使用結構化的 JSON 輸出來策劃個人化購物清單,使家具和裝飾與房屋的建築風格相匹配
⚡ 透過平行處理多個 AI 模型提供即時結果,在幾分鐘內(而不是幾週)提供完整的設計包
這項提交表明, Google AI Studio不僅僅是一個研究工具,而是一個用於建立可投入生產的應用程式的實用平台,它可以顛覆傳統產業,讓每個人都能享受專業服務。
透過全面的技術實施,我希望激勵開發人員、設計師和企業家探索多模式人工智慧,以建立真正實現專業知識民主化並使用戶能夠將他們的願景變為現實的工具。
<a id="whatibuilt"></a>
DreamNest.ai是一個全面的人工智慧家居設計平台,它徹底改變了傳統的建築設計流程。使用者無需昂貴的諮詢、技術圖面以及數週的反覆溝通,只需透過直覺的表單輸入需求,即可在幾分鐘內獲得完整的設計方案。
該平台解決了設計可存取性和可視化的關鍵問題。它解決了以下問題:
視覺化差距:大多數人無法解讀技術藍圖或從二維平面圖想像空間
成本障礙:專業的建築視覺化成本高且耗時
溝通挑戰:將個人願景轉化為技術要求很困難
決策癱瘓:由於看不到選項,使用者很難做出設計決策
DreamNest 創造的體驗是賦能與啟發。透過將複雜的建築概念轉化為美觀易懂的視覺效果,它幫助使用者對他們最重要的投資——家——做出自信的決策。
<a id="demo"></a>
即時應用: DreamNest.ai - 人工智慧家居設計師
{% 嵌入 https://youtu.be/UDjLUW-T\_II
%}
{% 嵌入 https://github.com/mohamednizzad/DreamNest.AI %}
1. 直覺的輸入表單:簡潔的多部分介面,用於指定房屋要求,包括地塊尺寸、建築風格、房間數量和特殊功能。
2. 即時產生進度:動態載入介面,分階段更新,向使用者準確顯示正在產生的內容。
3.綜合結果展示:
逼真的外部和內部渲染
詳細的二維建築藍圖
3D娃娃屋風格的平面圖
電影影片漫遊之旅
透過文字轉語音的方式提供語音引導的房產描述
精心挑選的購物清單,包含家具和裝飾推薦
4.互動功能:
白天/夜晚主題切換,方便使用者使用
可下載的設計資產以供離線使用
針對所有裝置最佳化的響應式設計
優雅降級的錯誤處理
<a id="studio"></a>
{% 嵌入 https://youtu.be/awclhqNzfT0 %}
整個 DreamNest 平台圍繞著多個 Google AI Studio 模型的複雜編排建置,每個模型都針對特定任務進行了最佳化:
// Core generation pipeline using multiple Gemini models
const generateDesignAssets = async (formData: FormData): Promise<DesignAssets> => {
const basePrompt = generatePrompt(formData);
// Parallel text generation with Gemini 2.5 Flash
const [walkthroughScript, shoppingList] = await Promise.all([
generateWalkthroughScript(basePrompt),
generateShoppingList(basePrompt), // Uses structured JSON output
]);
// Image generation with Imagen 4.0
const images = await generateImages(basePrompt);
// Floor plan generation (2D and 3D)
const [plan2D, plan3D] = await Promise.all([
generate2DPlan(basePrompt),
generate3DPlan(basePrompt),
]);
// Video generation with Veo 2.0 (rate-limited)
const videoUrl = await generateVideo(basePrompt);
return { images, videoUrl, walkthroughScript, shoppingList, plan2D, plan3D };
};
// Shopping list generation with JSON schema
const response = await ai.models.generateContent({
model: 'gemini-2.5-flash',
contents: shoppingPrompt,
config: {
responseMimeType: 'application/json',
responseSchema: {
type: Type.ARRAY,
items: {
type: Type.OBJECT,
properties: {
name: { type: Type.STRING },
description: { type: Type.STRING },
priceRange: { type: Type.STRING },
},
required: ["name", "description", "priceRange"],
},
},
},
});
const imageResults = await Promise.all([
ai.models.generateImages({
model: 'imagen-4.0-generate-001',
prompt: `Photorealistic, ultra-detailed exterior view of ${prompt}. Cinematic lighting, 8k resolution.`,
config: { numberOfImages: 1, aspectRatio: "16:9" },
}),
ai.models.generateImages({
model: 'imagen-4.0-generate-001',
prompt: `Photorealistic interior view of living room and kitchen. Natural lighting, warm and inviting.`,
config: { numberOfImages: 1, aspectRatio: "16:9" },
})
]);
const operation = await ai.models.generateVideos({
model: 'veo-2.0-generate-001',
prompt: `Aerial and cinematic 3D architectural walkthrough of ${prompt}. Hyperrealistic rendering.`,
config: { numberOfVideos: 1 }
});
對昂貴的操作實施智慧速率限制:
// Video generation cooldown to manage API costs
const VIDEO_GENERATION_COOLDOWN_MS = 60 * 60 * 1000; // 1 hour
const lastVideoGenTimestamp = localStorage.getItem('lastVideoGenerationTimestamp');
if (timeSinceLastGen < VIDEO_GENERATION_COOLDOWN_MS) {
updateStatus(setGenerationStatus, 'Video Generation',
`Skipped: Hourly limit active. Try again in ${minutesRemaining} mins.`);
}
<a id="features"></a>
DreamNest 透過整合設計流程展示了 Google AI Studio 的全部多模式功能:
文字到圖像的流程:使用者文字需求→詳細提示→逼真渲染
文字到影片的流程:架構描述 → 電影示範影片
文字到結構化資料:設計要求→JSON格式的購物清單
多格式藍圖:單一提示→2D 技術圖和 3D 視覺化
該平台透過以下方式保持所有生成資產的設計一致性:
使用來自使用者輸入的一致基本提示
將特定於樣式的修飾符套用至每種生成類型
確保二維平面圖、三維視圖和逼真渲染的建築精度
將家具推薦與生成的視覺風格相匹配
並行處理:多個 AI 模型同時工作以減少等待時間
優雅降級:如果影片生成失敗,其他資產仍然有價值
即時回饋:使用者可以看到每個資產產生的進度更新
增量載入:每個元件準備就緒後立即顯示結果
<a id="problem"></a>
DreamNest 解決了家居設計產業的基本挑戰:
可近性:讓每個人都能獲得高品質的建築視覺化,而不僅僅是那些能負擔得起專業設計師的人
速度:將設計迭代時間從幾週縮短到幾分鐘
成本:省去了初始設計探索的昂貴諮詢費
理解:將科技藍圖轉化為直覺的視覺表現
空間理解:3D 平面圖幫助使用者了解房間關係和流動
風格探索:逼真的渲染讓使用者看到適用於其特定需求的不同建築風格
物料規劃:購物清單將設計願景與可行的採購決策連結起來
溝通:產生的資產提供了一種與承包商和家人討論設計的通用視覺語言
建築敘事:語音引導的漫遊在空間建成前建立情感聯繫
跨模式驗證:2D 藍圖、3D 視覺化和逼真渲染為同一設計提供多種視角
情境商務:購物推薦基於視覺風格分析生成,而不僅僅是文字描述
漸進式揭露:資訊分階段揭露(形式→進展→結果),以防止認知超負荷
<a id="best"></a>
全面的資產展示:透過直覺的導航有組織地呈現所有產生的內容
語音整合:使用瀏覽器 API 的演練腳本的文字轉語音功能
主題管理:持久的暗/亮模式,平滑過渡
下載功能:使用者可以儲存生成的圖像和計劃以供離線使用
錯誤處理:優雅的故障模式,具有清晰的用戶回饋和恢復選項
// Structured error handling with user-friendly messages
try {
const assets = await generateDesignAssets(formData, setGenerationStatus);
setDesignAssets(assets);
} catch (err) {
const errorMessage = err instanceof Error ? err.message : 'An unknown error occurred.';
setError(`Failed to generate design. ${errorMessage}`);
} finally {
setIsLoading(false);
}
並行 API 呼叫:獨立操作同時執行,以最大限度地減少總生成時間
漸進式載入:隨著每個資源可用,UI 會進行更新
記憶體管理:針對影片內容正確管理 Blob URL
狀態管理:清晰地分離載入、錯誤和成功狀態
直覺流程:從輸入→產生→結果的清晰進程
視覺回饋:載入旋轉器、進度訊息和狀態指示器
響應式設計:針對行動裝置、平板電腦和桌面檢視進行了最佳化
可存取性:ARIA 標籤和語義 HTML,可相容於螢幕閱讀器
<a id="details"></a>
前端:React 19 + TypeScript 用於類型安全元件開發
樣式:Tailwind CSS,用於實用優先的響應式設計
AI 整合:適用於所有多模式操作的 Google AI Studio SDK( @google/genai
)
狀態管理:具有自訂狀態管理的 React Hooks
建置系統:Vite 用於快速開發和優化生產建置
// Service layer abstraction for clean separation of concerns
export const generateDesignAssets = async (
formData: FormData,
setGenerationStatus: React.Dispatch<React.SetStateAction<GenerationStatus>>
): Promise<DesignAssets> => {
// Orchestrate multiple AI model calls with progress tracking
const basePrompt = generatePrompt(formData);
// Sequential and parallel operations optimized for performance
updateStatus(setGenerationStatus, 'Initialization', 'Crafting design brief...');
const [walkthroughScript, shoppingList] = await Promise.all([
generateWalkthroughScript(basePrompt),
generateShoppingList(basePrompt),
]);
// Continue with image and video generation...
};
平台:Google Cloud Run,用於無伺服器擴展
環境:具有環境變數管理的 Node.js 執行時期
安全性:透過安全環境變數管理 API 金鑰
監控:內建錯誤追蹤和效能監控
src/
├── components/ # Reusable React components
│ ├── Header.tsx # Navigation and theme toggle
│ ├── InputForm.tsx # User requirement collection
│ ├── GenerationProgress.tsx # Real-time status display
│ ├── ResultsDisplay.tsx # Generated asset presentation
│ └── ProductCard.tsx # Shopping list item display
├── services/ # External service integrations
│ └── geminiService.ts # Google AI Studio API wrapper
├── types.ts # TypeScript interface definitions
└── App.tsx # Main application orchestration
<a id="challenge"></a>
本次提交完全滿足「建置和部署多模式小程式」挑戰的所有要求:
✅基於 Google AI Studio 建置- 使用 Google AI Studio 的綜合 API 套件開發,並整合多種模型
✅使用 Cloud Run 部署- 在 Google Cloud Run 上進行生產部署,具有自動擴展和高可用性
✅多模式功能- 實現多種 Gemini 功能:
Gemini 2.5 Flash用於文字產生(演練腳本、藍圖描述)和結構化 JSON 輸出(購物清單)
Imagen 4.0用於產生逼真的影像(外部/內部渲染、2D/3D 平面圖)
Veo 2.0用於電影視訊生成(3D 建築漫遊)
**語音生成
// Hypothetical future API
const generateVoiceNarration = async (script: string) => {
const response = await ai.models.generateAudio({
model: 'text-to-speech-model',
text: script,
voice: 'professional-narrator'
});
};
生產就緒:完整的錯誤處理、速率限制和使用者體驗優化
成本意識:對昂貴操作進行智慧速率限制
可擴展架構:清晰的關注點分離和模組化設計
實際應用:滿足家居設計產業真正的市場需求
<a id="future"></a>
音訊整合:使用 Gemini 的音訊理解功能進行語音輸入,描述設計偏好
互動式改進:基於使用者回饋迭代設計的對話式人工智慧
風格轉換:將不同的建築風格應用於現有設計
永續性分析:人工智慧驅動的環保材料和能源效率建議
市場整合:將使用者與真正的承包商和供應商聯繫起來
VR/AR 視覺化:沉浸式觀看產生的設計
協作功能:多用戶設計會話和共享功能
行動應用程式:整合式相機的原生 iOS/Android 應用程式
成本估算:人工智慧驅動的建築成本分析
許可協助:自動檢查建築規範合規性
時間軸規劃:專案進度安排和里程碑追蹤
供應商匹配:人工智慧驅動的承包商和供應商推薦
<a id="lessons"></a>
建置DreamNest.ai為多模式 AI 開發和生產部署提供了寶貴的見解:
🔄 編排複雜性:管理多個 AI 模型需要仔細協調 API 呼叫、錯誤處理和進度跟踪
💰 成本管理:視訊生成等昂貴的操作需要智慧速率限制和用戶通信
⚡ 效能最佳化:平行處理大大改善了使用者體驗,但需要仔細的資源管理
🎯 提示工程:跨模型的一致、詳細的提示確保一致的輸出質量
📱 漸進式揭露:將複雜的生成過程分解為多個階段,可防止使用者在長時間操作過程中產生焦慮
🎨 視覺連貫性:在不同的 AI 生成的資產中保持一致的風格需要仔細的提示設計
🔄 錯誤復原:優雅降級和清晰的錯誤訊息對於使用者信任至關重要
⏱️ 期望管理:即時進度更新顯著提升感知績效
🏠 市場驗證:使用者對無障礙設計工具的濃厚興趣證實了市場需求
🤖 人工智慧作為推動者:人工智慧不會取代人類的創造力,但會大大增強可存取性和速度
💡 民主化影響:讓專業工具觸手可及可能顛覆傳統的服務業
🔮 未來潛力:多模態人工智慧為全新的使用者體驗和商業模式開闢了可能性
🏗️ 架構至關重要:AI 服務和 UI 元件之間的清晰分離可實現快速迭代
📊 結構化輸出:使用 JSON 模式進行 AI 回應可消除解析錯誤並提高可靠性
🛡️ 防禦性程式設計:全面的錯誤處理和回退對於生產 AI 應用程式至關重要
📈 可擴展設計:從一開始就進行可擴展建置,可以避免以後昂貴的重構
<a id="conclusion"></a>
建構DreamNest.ai是一段不可思議的旅程,它展現了Google AI Studio 多模態功能的變革潛力。這個計畫表明,人工智慧不僅僅是實現現有流程的自動化,它還能夠創造全新的可能性,並使專業知識的獲取更加民主化。
透過將Gemini 2.5 Flash 、 Imagen 4.0和Veo 2.0整合成統一的平台,DreamNest 將傳統上專屬的建築設計領域轉變為便捷直覺的體驗。使用者現在可以透過專業品質的渲染圖來視覺化他們的夢想家園,透過多種視覺格式理解空間關係,並在 AI 生成的指導下做出明智的決策。
技術實現證明,多模態人工智慧能夠賦能生產級應用,解決實際問題。透過精心編排多種模型、智慧成本管理和以使用者為中心的設計,我們打造了一個真正賦能使用者的平台,同時展現了人工智慧技術的實際潛力。
這個計畫不僅代表著一項技術成就,更展現了人工智慧將使專業知識民主化,讓每個人都能享受專業品質服務的未來。我希望 DreamNest 能激勵其他開發者探索多模態人工智慧的創意可能性,並建立真正改善人們生活的應用程式。
人工智慧的未來不僅在於更智慧的演算法,更在於創造更便利、更人性化、更賦能的體驗。 DreamNest.ai 只是一個開始。
利用人工智慧的力量將您的家居設計夢想變成現實。
👉啟動 DreamNest.ai - 由Google AI Studio提供支援
用❤️為Dev.to打造 — 由Google AI Studio提供支持