🔧 阿川の電商水電行

Shopify 顧問、維護與客製化

💡

小任務 / 單次支援方案

單次處理 Shopify 修正／微調

⭐️

維護方案

每月 Shopify 技術支援 + 小修改 + 諮詢

🚀

專案建置

Shopify 功能導入、培訓 + 分階段交付

👉 瞭解詳情 / 免費諮詢

小編精選 - 技術文章翻譯 · 10月01日

一個簡單的提示，指示AI產生“與原始圖像相似”的圖像

前言

在資料製作或部落格文章中，是否曾有過「這張圖片正好符合我的需求，但因為著作權問題無法直接使用…」的煩惱？
這時候有用的就是，利用AI生成「類似氛圍的原創圖片」的技巧。
本文將介紹如何讓AI深入理解原始圖片的「本質」，並透過強大的提示技術生成意圖中的那種「感覺」的圖片。
這是一種不受特定圖片生成AI模型限制的，具有廣泛應用的技巧。
此次我們使用了gemini2.5pro。

步驟1：準備範本圖片

首先，準備一張「想要這種氛圍的圖片」作為範本（原圖片）。
這次的範例中，我們使用自己的頭像圖片。

步驟2：指示AI分析圖片

接下來，為了讓AI深入理解原圖片的魅力，使用以下提示進行分析。
此提示的關鍵在於，從①抽象的結構、概念和氛圍及②具體的結構、所見的信息這兩種不同的視角進行多角度的分析。

圖片分析提示

請針對以下圖片，使用以下兩種類型進行全面性結構化的詳細語言化。

# 形而上結構 (Metaphysical Structure)
1. 本質 (Essence)
2. 要素 (Elements)
3. 構成 (Composition)
4. 文脈 (Context)
5. 精緻 (Refinement)
6. 風格 (Style)

# 形而下結構 (Physical/Material Structure)
1. 前提 (Premise)
2. 情況 (Situation)
3. 動機 (Motive)
4. 目的 (Objective)
5. 限制 (Constraints)
6. 構圖 (Composition)
7. 語調 (Tone)

步驟3：檢查AI的分析結果

執行提示後，AI將以下列方式將圖片詳細語言化。這些「語言化的資訊」將成為生成新圖片的設計藍圖。

好的，我明白了。您提供的圖片將從兩種分析類型進行全面及結構化的語言化。

形而上結構 (Metaphysical Structure)

1. 本質 (Essence)

這張圖片的本質是「日常中侵入的非日常」，是現代勞動環境中「逃避角色與諷刺」的寓言。象徵輕鬆和療癒的「懶熊」，深陷於需要緊張與紀律的辦公室空間中的「工作行為」。這種強烈的對比與矛盾本身，形成了圖片的核心意義。

2. 要素 (Elements)

懶熊的頭部： 匿名性、遊戲性、角色性、現實逃避的象徵。
辦公桌： 勞動、義務、現實、壓力的象徵。
電腦（ThinkPad）： 智慧勞動、生產力、科技的象徵。
雜亂的私物： 生活感、個人領域、混沌、工作忙碌的象徵。
黑色衣服： 突顯角色的存在，使其中人物的個性消失。

3. 構成 (Composition)

建立在「癒合的角色（非日常）」與「勞動的工具（日常）」面對的核心對立結構上。角色的巨大頭部與無機質且實用的電腦或鍵盤之間的物質不均衡，形成了視覺上的幽默與違和感。

4. 文脈 (Context)

拍攝地點推測為IT或創意類企業的相對自由社風的辦公室。這張照片捕捉了在嚴格的勞動環境中想要找回幽默或人性的微小抵抗，亦或是同事間交流的一瞬間。

5. 精緻 (Refinement)

不僅僅是「變裝」，而是選擇在日本廣為人知的「懶熊」，使得這個影像的意義更為精緻。以「放鬆」為存在理由的角色，卻從事最不放鬆的行為（桌面工作）的諷刺，讓這個訊息更加明確且具共鳴。

6. 風格 (Style)

並非刻意製作的藝術照片，而是偶然捕捉到的「快照」風格。這種隨性、真實的風格賦予非現實的景象以奇妙的真實感，突顯超現實的幽默。

形而下結構 (Physical/Material Structure)

1. 前提 (Premise)

在辦公室的一角，有一個人正在進行電腦工作。

2. 情況 (Situation)

該人戴著一個巨大的懶熊面具（或是角色裝扮的一部分）。桌子上散落著筆記本電腦、外接鍵盤、滑鼠、飲料、文具等，顯得雜亂不堪。

3. 動機 (Motive)

此行為的動機並非為了生產性業務的執行，而是「活躍氣氛」「拍攝有趣的照片」「釋放壓力」等情感與遊戲性原因。

4. 目的 (Objective)

此情況下的直接目的，是以懶熊的形象操作鍵盤，「讓角色正在工作的場景得以呈現」。若涉及拍攝，則記錄與分享也在目的之內。

5. 限制 (Constraints)

物理限制： 巨大的頭部嚴重妨礙視線，準確打字或滑鼠操作極為困難。生產性工作實質上是不可能的。
環境限制： 由於辦公室是公共的工作空間，這一行為被允許的時間及周遭情況都受到限制。

6. 構圖 (Composition)

以斜側角度捕捉被攝體，角色的側面和整個桌面都被框入畫面。懶熊的圓型頭部佔據畫面的左半部，視線（角色的目光方向）自然引導到右側的筆記型電腦。背景的吉他與黃色櫃子顯示出這個工作場所並非單調一致。

7. 語調 (Tone)

螢光燈所帶來的平坦且均勻的照明，傳遞出辦公空間的真實氛圍。加工或演出較少的自然寫照，像是紀錄這一非現實事件，反而強調了幽默且超現實的語調。

步驟4：根據分析結果生成新圖片

最後，指示AI根據這些詳細的分析結果，生成新圖片。

【指示提示】

根據上述語言化的內容，生成新圖片。

然後，AI就像人類一樣理解原始圖片的「氛圍」和「概念」，並生成一幅重現它的新圖片。

生成的圖片如下

生成的圖片
這幅圖片出色地重現了原始圖片中角色在辦公室進行電腦工作的超現實和幽默氛圍及構圖，同時解決了著作權問題，完成了一幅全新圖片。

總結：使用此提示技巧的優點

利用這項技巧，能夠遠比單純指示「像〇〇的圖片」來得精準再現原圖片的意圖和氛圍。

具應用性： 可應用於各種圖片，準確地向AI傳達「想表達的細微差別」。
拓展創意： 透過閱讀AI的分析，可重新發現原本未注意的圖片魅力，並獲得新的創意靈感。

若在資料製作或內容創作上遇到難以找到「剛好的圖片」的問題，請務必嘗試此「分析→生成」的技巧。

原文出處：https://qiita.com/makotosaekit/items/24ec9b81f8d49057caa2

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

1個讚 0留言 312瀏覽

按讚的人：

共有 0 則留言

登入之後發表留言

文字內容提供幾種功能：
1) --- 會變成分隔線（上一行必須是空白）
2) # 會變成一級標題
3) ## 會變成二級標題
4) ### 會變成三級標題
5) **粗體文字**會顯示粗體文字
6) ```當第一行與最後一行會顯示程式碼
7) 請搜尋 Markdown 語法，了解各種格式

小編精選 - 技術文章翻譯

精選技術文章翻譯，幫助開發者持續吸收新知。

🏆 本月排行榜

🥇

站長阿川

📝21 💬3

560

🥈

我愛JS

📝1 💬5 ❤️2

🥉

徐浩瑋

評分標準：發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10

本數據每小時更新一次