本記事是2025年11月5日舉辦的Meetup學習會「Oracle Cloud Hangout Cafe(OCHaCafe)」的發表內容,並附加了參考資料與連結。
當天的影片在這裡👇
當天的資料
閱讀本文,您將能夠大致了解Dify。
從未接觸過的人可以想「試試看」,而已經在使用的人則希望能成為「下一步的提示」。
因內容較多,請從感興趣的項目開始閱讀!
在過去1-2年中,Dify在全球及日本迅速受到關注。
即使尚未接觸過,也許多數人都聽過這個名字。
Dify在公共、行政和企業現場實際應用的案例增多。
最近有以下話題的案例。
在同一選舉活動期間,團隊未來的「AI安農」也有運用Dify。
在解釋Dify之前,首先需要理解的是「AI代理人」的概念。
提到Dify,相關詞彙中可能會浮現出「AI代理人」。
實際上,Dify不僅是簡單的RAG聊天機器人構建工具,而是被設計為能夠實際創建、運行和操作AI代理人的平台。
因此,在理解Dify的價值之前,我們想簡單整理一下「AI代理人是什麼」和「目前AI可以做什麼及未來的樣貌」。

Dify是什麼→「最前端的Agentic AI開發平台」
自2022年底ChatGPT問世以來,「提問時AI會回答」的體驗瞬間普及。
最初的AI應用主要集中於FAQ應對、內部聊天機器人、文件生成等“人類指示,AI回應”的形式。
然而,隨著AI技術的進步,
“不再是問AI問題,而是將目標傳達給AI,讓它自行決定如何進行”的趨勢逐漸形成。
換句話說,AI不僅僅是一個工具,而是被視為“主動思考和行動的代理人”,並被要求在企業中被使用。
從自動化的歷史來看,以前的AI只是在遵循人類的指示,但在AI代理人的情況下,
AI開始成為主導去執行任務,
不再需要人類細緻地指示步驟,而是根據情況作出判斷,自行獲取所需信息,調用工具並執行任務——這種角色變得越來越重要。

查詢「AI代理人」的定義會發現不同行的解釋,但可以這樣定義:
一個AI程式,代替用戶或系統,計劃、判斷並執行達成目標的任務
也就是說,它不僅僅是回答提示問題,
這是一個不斷重複「Think → Act → Reflect」的存在。
儘管稱為AI代理人,但根據結構和自我思考及行動的自主性,可以分為幾種類型。
工作流程型是利用AI的形式,但是按照人類決定的步驟線性處理,「準確執行預定動作」的形式。
單一代理型則是AI理解目標,自行判斷並進行API調用和信息獲取。
更高級的是多代理型,由多個AI分擔角色,協同解決問題的機制。
| 類型 | 特徵 |
|---|---|
| 工作流程型 | 順序執行預定的處理流程 |
| 單一代理型 | 單一AI邊思考邊執行直至達成目標 |
| 多代理型 | 多個代理人分擔角色,協調解決任務 |

最近除了「AI代理人」外,還出現了Agentic AI(代理型AI)的說法。
這兩者之間有何不同?
看似相似的概念,在相關的研究論文《AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges》中有以下梳理。

也就是說,
先前提到的AI代理人包括「工作流程型」、「單一代理型」和「多代理型」這幾個階段。
Agentic AI不僅是AI自主運作,還要分解目標,進行判斷,根據需要與其他代理人或工具、數據協同完成任務。因此可以說是一種更接近「多代理型」來執行任務的概念。
截至2025年前半期,許多企業仍停留在將AI融入業務流程的「工作流程型」應用,還有少數企業實現了可自主運作的系統。
其背景是實際運用仍有許多待解決的問題。單一代理的AI在運行中可能會出現不準確的回答(幻覺),或推理過程淺薄的問題。
而多代理的AI合作運作可能存在意圖不合導致停滯,結果表現不一致,內部運作難以窺探等,使得穩定運行成為難題。

另一方面,從調查結果可知,許多企業將「代理型AI(自律型代理人)」與「多代理人」的應用視為重要的下一步階段,實際上也有越來越多的企業進行PoC和驗證。
究竟什麼時候會真正實現AI自律運行的「完全自律代理人」呢?
根據各企業和研究機構的報告,完全自律AI(通用AI代理人)的實現時期預測在「2030年代前半至2040年代以後」,技術上仍有許多不確定性。
不過,專注於特定業務的「限定自律代理人」在2030年左右有可能實用化。因此,可以看出並不是說可以突然出現全能的AI,而是會先有「可以執行特定任務的AI代理人」逐漸變得現實可行。
至此內容的整理如下:
AI的角色處於轉型期
從「回答問題的AI」轉變為「理解目標並行動的AI代理人」。
代理人也有類型與階段
從工作流程型 → 單一代理型 → 多代理型不斷進化。
不過現實仍在過渡中
許多企業僅停留在工作流程型,代理人導入仍處於PoC階段,精確性、穩定性及協作等問題依然存在。
例如幻覺問題、不穩定行為及協作的難度等等。
這樣看來,AI正邁向「自律性行動的存在」,但仍處於過渡期。
目前所需的是實際可運用的形式將代理人融入業務中。
這樣的「在實驗中實際可用的實作」階段,正是像Dify這樣的平台所支撐的。
接下來的章節將探討Dify是什麼,以及它的優勢。
Dify是「使用AI(LLM)輕鬆開發及運行應用的開源平台」。
查閱Dify的文檔可以看到,Dify是BaaS(Backend as a Service)與LLMOps相結合,提供了認證、資料庫、儲存、開發UI等AI應用開發所需的一整套後端平台。

為了理解Dify的優勢,首先要了解它實際適用的場景。
在過去的1-2年中,Dify在國內企業和自治體中的導入案例已公開了幾個。
以下是基於公開資訊整理的一些案例,但除了這些,最近在LangGenius主辦的會議「IF Con Tokyo 2025」中,許多企業和組織登臺介紹了他們的導入與運作情況。
這樣的動向顯示,Dify的應用已在穩步增長。
| 企業・自治體 | 事例 |
|---|---|
| CyberAgent | 約20%員工使用,每月減少超過3000小時。全公司推廣的方式及非工程人員的迅速擴大也有官方公開。 |
| IIJ | 官方技術部落格中多次提到Dify的應用案例,九州分公司發起「RFC 9,573文件的引入與RAG化」等實踐例。 |
| Kakaku.com/食べログ | 全公司導入及高頻使用的報告,並在技術部落格中發布社內用Bot等應用案例,支持食べログ的商家介紹文章撰寫。 |
| 東京都 | 在雲端運行Dify,成為各局AI應用開發的基礎。東京都設置了AI應用相關的專家委員會。 |
| 町田市 | 更新「AI導航器」。通過引入Dify,增強了多個LLM的整合和回答能力,提高了虛擬市政府的導覽性能。 |
| Ricoh、NTT Data、CTC | 運用Dify的企業計劃提供和構建合作夥伴合同。 |
那麼,為什麼Dify開始受到重視並被實際選擇使用呢?
這一背景在於,現今AI應用所需的要求與Dify具備的機制相符。
許多企業和自治體不僅僅需要像ChatGPT這樣的對話型AI,還需要能夠融入業務流程的能力,能夠兼顧安全性與成本,並且在無需專業知識的情況下也能在現場進行改進與運用。
Dify正是通過OSS的靈活性、支持多個LLM的能力、無需編碼的應用構建及易於展開和重用的基礎架構來回應這些需求。
Dify作為開源公開,允許檢視其源代碼及內部規範。這樣可以讓企業根據自身的要求進行定制化或功能擴展。此外,可以在公司內部網絡或封閉環境中運行,從而避免將機密信息發送至外部服務。Community Edition為無償使用,且支持商用,因此初期導入的門檻低。
作為OSS不斷進行改進的特性,對於長期採用的考量也是重要因素。
Dify不僅兼容OpenAI和Azure OpenAI等主要模型,還支持40多個不同的LLM供應商,也兼容OCI Generative AI。
您可以根據用途、精度和成本在模型間切換,甚至可以在同一應用內使用不同的模型。
此外,還可透過日誌或分析介面查看每次執行的令牌使用量和API成本,並支持通過Langfuse等外部工具進行高級分析。自動執行或循環處理也能設置次數限制,這在實際運行中有助於控制成本與防止誤操作。
以往的AI應用開發需藉助LangChain等框架並依賴Python進行編碼。Dify則可在視覺編輯器上構建提示、工具調用及分支處理,因此即使是非工程人員也能自主創建原型或PoC。
Dify還提供模板,使用者可以立即嘗試RAG搜尋、聊天機器人和代理型的構成。此外,實行日誌、歷史記錄、重新執行及權限管理等運營功能也一應俱全,讓開發與運用都能在同一介面上完成。
Dify提供的流或代理人可用DSL格式進行匯出,以便於在其他專案或部門展開。團隊或整個組織都能使用相同的平台,因此開發、審核和運用的基礎設施易於統一,不易造成個人化的實施。
運營負責人、現場部門與IT部門可以在同一基礎上分工協作,易於將AI應用從個別試驗過渡到組織活動。
以上便是Dify符合當前AI需求並受到選擇的主要原因。
接下來的章節將探討如何開始使用Dify,基本構成及主要組件的介紹。
Dify主要提供兩種:「雲端版(SaaS)」與「自我託管版(OSS)」。
可立即註冊帳戶開始使用,無需建立環境
根據使用規模有以下三個計畫:
| 計畫 | 收費 | 預期使用者 |
|---|---|---|
| Sandbox | 免費 | 個人及試用用途 |
| Professional | $59/月 | 小型團隊向 |
| Team | $159/月 | 中型團隊/共同開發方式向 |
可在自我環境中運作
還有專為商業或大規模運作設計的變種計畫:
| 版本 | 特徵 |
|---|---|
| Community | 完全免費的OSS版本 |
| Premium | 透過AWS Marketplace等提供/可進行品牌定制 |
| Enterprise | 企業要求的安全性、稽核及SAML等功能 |
到目前為止,我們已經整理了「Dify是什麼」、「為何受到關注」以及「如何應用」的全貌。
接著就來到實踐篇了。
要理解Dify,最直接的方法是親手操作。但切記,初步不應直接開始構建,按照以下流線進行會更為順利。
👉 Step0. 準備環境
首先準備一個可運行Dify的環境(雲端版或自架環境)。
👉 Step1. 掌握基本畫面及應用程序的類型
了解每個畫面所能做的事,以及聊天/工作流程/代理等的“類型”。
👉 Step2. 嘗試範例,製作RAG聊天機器人或簡單的工作流程
使用模板和教程,先體驗可運作的基本功能。
👉 Step3. 針對身邊的問題進行簡單挑戰
例如「搜尋內部資料」或「FAQ回應機器人」,讓其與自己的業務相互結合。
👉 Step4. 研發解決自身問題的應用!(進階篇)
將內容提升到實際業務使用的水平,製作出能解決課題的應用程式。
接下來我們將進入「建立環境」的章節。
那麼讓我們馬上開始準備可使用Dify的環境吧。
■ 若使用雲端服務
您可以在註冊帳戶後立即開始使用。
■ 若選擇社區版(自我託管)
源代碼已公開在Github上:https://github.com/langgenius/dify
可透過Docker Compose或本地源代碼來部署,只需確保您有Docker及docker compose的運行環境即可進行搭建。
這次,我們在OCI上構建Dify環境進行測試。
在Compute上運行Dify,為了知識庫和向量搜尋,利用了託管的數據庫服務Autonomous Database、LLM模型採用OCI Generative AI,數據儲存則使用Object Storage。
將來的工作流程和RAG構建也將基於此結構進行。

接下來對於在OCI上構建Dify環境的參考文章如下。
- 僅透過GUI構建OCI環境的步驟
透過此Terraform範本,無需命令即可創建基於OCI資源的Dify環境!
- 使用Docker Compose在OCI Compute上啟動Dify的步驟
- OCI Generative AI的設置步驟
當您首次登入Dify時,將創建管理者帳戶,同時提供一個工作區。
可以邀請其他用戶共同使用該工作區。
而多工作區的使用則需在企業版中才可用。

此外,提前設定使用的LLM模型的API金鑰,將使您能夠迅速開始創建應用。