在資料製作或部落格文章中,是否曾有過「這張圖片正好符合我的需求,但因為著作權問題無法直接使用…」的煩惱?
這時候有用的就是,利用AI生成「類似氛圍的原創圖片」的技巧。
本文將介紹如何讓AI深入理解原始圖片的「本質」,並透過強大的提示技術生成意圖中的那種「感覺」的圖片。
這是一種不受特定圖片生成AI模型限制的,具有廣泛應用的技巧。
此次我們使用了gemini2.5pro。
首先,準備一張「想要這種氛圍的圖片」作為範本(原圖片)。
這次的範例中,我們使用自己的頭像圖片。
接下來,為了讓AI深入理解原圖片的魅力,使用以下提示進行分析。
此提示的關鍵在於,從①抽象的結構、概念和氛圍及②具體的結構、所見的信息這兩種不同的視角進行多角度的分析。
請針對以下圖片,使用以下兩種類型進行全面性結構化的詳細語言化。
# 形而上結構 (Metaphysical Structure)
1. 本質 (Essence)
2. 要素 (Elements)
3. 構成 (Composition)
4. 文脈 (Context)
5. 精緻 (Refinement)
6. 風格 (Style)
# 形而下結構 (Physical/Material Structure)
1. 前提 (Premise)
2. 情況 (Situation)
3. 動機 (Motive)
4. 目的 (Objective)
5. 限制 (Constraints)
6. 構圖 (Composition)
7. 語調 (Tone)
執行提示後,AI將以下列方式將圖片詳細語言化。這些「語言化的資訊」將成為生成新圖片的設計藍圖。
好的,我明白了。您提供的圖片將從兩種分析類型進行全面及結構化的語言化。
這張圖片的本質是「日常中侵入的非日常」,是現代勞動環境中「逃避角色與諷刺」的寓言。象徵輕鬆和療癒的「懶熊」,深陷於需要緊張與紀律的辦公室空間中的「工作行為」。這種強烈的對比與矛盾本身,形成了圖片的核心意義。
建立在「癒合的角色(非日常)」與「勞動的工具(日常)」面對的核心對立結構上。角色的巨大頭部與無機質且實用的電腦或鍵盤之間的物質不均衡,形成了視覺上的幽默與違和感。
拍攝地點推測為IT或創意類企業的相對自由社風的辦公室。這張照片捕捉了在嚴格的勞動環境中想要找回幽默或人性的微小抵抗,亦或是同事間交流的一瞬間。
不僅僅是「變裝」,而是選擇在日本廣為人知的「懶熊」,使得這個影像的意義更為精緻。以「放鬆」為存在理由的角色,卻從事最不放鬆的行為(桌面工作)的諷刺,讓這個訊息更加明確且具共鳴。
並非刻意製作的藝術照片,而是偶然捕捉到的「快照」風格。這種隨性、真實的風格賦予非現實的景象以奇妙的真實感,突顯超現實的幽默。
在辦公室的一角,有一個人正在進行電腦工作。
該人戴著一個巨大的懶熊面具(或是角色裝扮的一部分)。桌子上散落著筆記本電腦、外接鍵盤、滑鼠、飲料、文具等,顯得雜亂不堪。
此行為的動機並非為了生產性業務的執行,而是「活躍氣氛」「拍攝有趣的照片」「釋放壓力」等情感與遊戲性原因。
此情況下的直接目的,是以懶熊的形象操作鍵盤,「讓角色正在工作的場景得以呈現」。若涉及拍攝,則記錄與分享也在目的之內。
以斜側角度捕捉被攝體,角色的側面和整個桌面都被框入畫面。懶熊的圓型頭部佔據畫面的左半部,視線(角色的目光方向)自然引導到右側的筆記型電腦。背景的吉他與黃色櫃子顯示出這個工作場所並非單調一致。
螢光燈所帶來的平坦且均勻的照明,傳遞出辦公空間的真實氛圍。加工或演出較少的自然寫照,像是紀錄這一非現實事件,反而強調了幽默且超現實的語調。
最後,指示AI根據這些詳細的分析結果,生成新圖片。
根據上述語言化的內容,生成新圖片。
然後,AI就像人類一樣理解原始圖片的「氛圍」和「概念」,並生成一幅重現它的新圖片。
這幅圖片出色地重現了原始圖片中角色在辦公室進行電腦工作的超現實和幽默氛圍及構圖,同時解決了著作權問題,完成了一幅全新圖片。
利用這項技巧,能夠遠比單純指示「像〇〇的圖片」來得精準再現原圖片的意圖和氛圍。
若在資料製作或內容創作上遇到難以找到「剛好的圖片」的問題,請務必嘗試此「分析→生成」的技巧。
原文出處:https://qiita.com/makotosaekit/items/24ec9b81f8d49057caa2