🔧 阿川の電商水電行
Shopify 顧問、維護與客製化
💡
小任務 / 單次支援方案
單次處理 Shopify 修正/微調
⭐️
維護方案
每月 Shopify 技術支援 + 小修改 + 諮詢
🚀
專案建置
Shopify 功能導入、培訓 + 分階段交付

我懷疑我不是第一個提出這個概念的人,但我可能是第一個給它命名的人。

兩年後,每個人都會走向決定論(DriDe,就像「DRY'd」——不要重複自己一樣),而我告訴你,從今天開始就應該這樣做。

如果要用一句話來解釋的話:我的建議是,雖然大多數人都在嘗試加入更多的人工智慧,然後加以保護,但我們應該建立這樣的系統:隨著時間的推移,我們將人工智慧完全/盡可能地從系統中移除。

好的,聰明的小伙子——什麼是「漂移到決定論」?

可惜,它並不是大家期待已久的《玩命關頭3》的第二部(雖然有點遺憾——不過,如果真是這樣,那該多棒啊!)。

不,它是一種關於你應該如何思考人工智慧的哲學理念。

大家都在使用人工智慧代理系統,並且像擔心代幣會用完一樣瘋狂銷毀代幣。

看到有人花 20 美元設定一個買牛奶的提醒,真是讓我心痛(是的,真的發生了……每隔 30 分鐘心跳一下查看時間,竟然消耗了代幣!)。

我相信我們很快就會從「人工智慧可以解決所有問題」的白日夢中醒來,意識到有一個簡單的流程可以讓我們以極低的成本和對環境的影響去做幾乎任何事情。

簡單步驟:

  1. 給人工智慧代理系統一個它以前從未見過的「新穎」任務,讓它消耗大量代幣來解決它。

  2. 在最後放置第二個代理系統,觀察哪些結果可以透過確定性的方式(即透過程式碼)得出。

  3. 為可重複使用的零件製造工具。

  4. 下次遇到類似任務時,請在步驟 1 投入工具。

  5. 看看我們是否總是使用工具 1 並將其饋送到工具 6——將它們連接起來。

  6. 重複此過程,直到寫出所有可能的 AI 部分。

  7. 有很多細微之處需要注意,例如如果某個工具無法提供合適的輸出結果,就回退到人工智能;執行工作流程的模擬版本來檢查我們是否真的在改進;提供最終輸出反饋以進行微調;建置一個LLM(語言學習碩士)能夠理解的系統;全面跟踪整個過程……不過,這些你肯定能搞定 :-)

隨著時間的推移,你那些執行成本為 50 美元、成功率只有 50% 的 AI 驅動的非確定性工作流程,會變成只需 0.02 美元 AI 即可進行分類,然後只需在程式碼中執行的強大自動化流程。

它速度更快,更穩定,更值得信賴。

這就是我們前進的方向。

是的,人們都在學習技能和工具,這有什麼新鮮的?

關鍵就在這裡——我們已經擁有了讓這件事成功所需的條件,但在對待這些條件的方式上卻從根本上做錯了。

沒有人,我是說沒有人,有這樣的意圖,就是把人工智慧從他們目前正在使用人工智慧的流程中剔除。

請你舉出一個過去一年人工智慧應用程度低於現在的工具/產品範例。

請繼續,我在等。

但這其實正是我要提出的建議。

你可以利用人工智慧來勾勒出流程的輪廓。雖然它成本高昂、速度較慢(與編寫程式碼相比),但它可以解決重複性的業務流程問題。

然後,你要分析這個過程。我真的需要把公司客戶名單上的全部 12,000 則資訊都輸入到人工智慧系統裡,才能知道接下來該打給誰嗎?當然不需要,一個簡單的工具就能找出 5 位一個月內還沒聯絡過的客戶。

我真的需要把那個工具給代理商嗎?不需要,我應該把它作為上下文的一部分,這樣代理就能獲取這些訊息,從而節省大量的往返通信。

等等,我們是不是要給人工智慧一個工具,讓它去找他們的網站?如果它需要這些訊息,我們應該自動獲取這些資訊並將其輸入到上下文中。

等等,我們之前不是已經瀏覽過他們的網站了嗎?我們有相關資訊?我們還需要經紀人介入嗎?

你明白我的意思。

結晶是關鍵

每次呼叫人工智慧,你都相當於擲骰子——毫不誇張地說。

情況已經好轉很多,但它始終是一個非確定性系統。無論你如何提示,它都會給出不同的輸出。

有時你需要人工智慧的力量——例如處理自然語言(或你需要嗎?)

或者寫程式碼(或者你會寫程式碼嗎?)

每次呼叫 AI 時,請質疑有多少工作需要使用 LLM 完全自主完成,又有多少工作是確定性步驟。

編寫程式碼-我們擁有世界上所有的程式碼片段,每個挑戰都可以分解成現成的、經過實戰檢驗的程式碼。我們只需要用不同的方式將它們連接起來。

那麼我們應該讓人工智慧編寫程式碼,還是給它已知有效的程式碼,讓它將這些程式碼連接起來以解決新問題?

處理自然語言?我們已經有了基於程式碼的工具,它們可以完成 LLM 70% 的工作——為什麼不讓它們進行初步處理,找出 LLM 應該集中精力處理的區域,從而減少上下文規模、成本和遺漏關鍵資訊的可能性呢?

規範你的流程。使其盡可能確定性和可重複性。

聽起來工作量很大。

嗯,算是吧。

目前確實存在能力差距,LLM(LLMs)雖然能夠很好地發現流程中可以優化的地方,但卻沒有足夠的創造力來弄清楚哪些部分最適合改進。

它仍然需要人類的判斷和指導(萬歲——我們目前仍然安全!)。

但它當然可以回顧自己做過的事情,然後指出需要改進的地方。

它當然可以採納你的判斷,並提供可能的解決方案。

你只需要動動腦筋,想想該研究什麼,用什麼方法去研究,以及該如何具體化或概括地設計一個功能/步驟。

一旦你建立了足夠多的這類工具(技能、MCP、工作流程等等),你就可以教它建立自己的工作流程。

這樣一來,你就變成了工作流程的評判者,而不是單一部分的評判者。

我的預測

2-5年後,您將坐在電腦前,面對一個全新的業務難題:我們需要實現銀行帳目自動對帳。

你需要解釋預期結果,提供好結果和壞結果的例子、資料等等。

人工智慧會利用所有工具,為你建立一個實現目標的流程。由於它目前還沒有所有需要的工具,所以仍然會使用視覺模型、擅長分類的邏輯學習模型等等。

您將在測試模式下執行它,與人工智慧合作調整其以應對極端情況,然後再執行它。它執行正常後,您可以將其切換到“影子模式”,並與當前進程並行執行。

現在它開始自我優化,退出這個過程。

它利用OCR和模式匹配技術,為每個供應商的發票格式建立獨立的解析器,每張發票的處理速度僅需幾毫秒。它會提取銀行回饋訊息,並將金額與發票進行核對,所有這些操作都在程式碼中完成,LLM(邏輯邏輯管理器)甚至無需啟動,只需啟動「對帳流程」即可。

它的運作效果與目前流程一樣好,準確率超過 99%,因為我們在 99% 的工作流程中都使用了確定性步驟。

三個月後,我們匯入的一份文件格式發生了變化——TensorFlow OCR 工具無法辨識發票號碼。它轉而使用視覺模型來定位發票號碼的新位置。系統會提示您“供應商 X 的發票格式似乎已更改——這是正確的號碼嗎?”,並顯示發票截圖,同時高亮顯示相關專案。

你告訴它一切就緒,它就會自我修復,然後跑去完成本月的銀行對帳工作。

相較之下,我們目前的設想是:針對每張發票呼叫一個願景模型,並為LLM(生命週期管理)提供一個工具。然後,我們再給它一個讀取銀行交易記錄的工具──將私有資料傳送到雲端。之後,它會將發票號碼誤認為帳號,請求幫助,我們提示後,它會更新指令集,但下一張發票的處理仍然失敗。

它成本高、速度慢、容易出錯,雖然比我們以前完全人工操作的流程要好,但遠非理想。

我對LLMs的看法

LLM 輸出的每一個令牌都是一個故障點。

即使我們能將 LLM 的準確率提高到 99.999%(這簡直太棒了,對吧?),如果你的工作流程有 10000 次迭代,你的輸出準確率又能有多高呢?

不,不是99%,而是90%。 (0.99999^10000是90%)

**90%的準確率對企業來說是致命的:你會被告上法庭或破產。 **

但是,如果你在建造 LLM 系統時只有一個目標:“讓自己變得過時”,那麼你就能蓬勃發展。

你可以從業務中剔除所有瑣碎的事務,所有耗費在無意義工作上的人力。

LLM 可讓您將樓宇自動化的成本降低到過去實施成本的 1%。

小企業可以以前所未有的規模,憑藉敏捷性在競爭中勝過大企業。

但前提是他們的系統夠強大。

所以,你是在建造幻覺工廠還是確定性發電機?

你是不是在打造一個能焚燒代幣、投擲骰子的怪物?

或者,你是在打造一個精簡高效、萬無一失的替代方案,取代低效率的現狀嗎?

可能介於兩者之間,但如果你做任何事的指導原則是「漂移至決定論」——那麼當你轉向決定論並且不要重複自己時,你就會獲得優勢。

你將擁有一個鋒利的手術工具來自動化關鍵工作流程,而你的競爭對手卻在用蠻力迫使他們的流程屈服,並走向災難。

降低成本、提高確定性、避免訴訟——這三個字加起來的價值肯定不低,至少有十億美元。

讓 DriDe 引領你走向成功,今天就開始漂移之旅吧。


原文出處:https://dev.to/grahamthedev/3-words-worth-a-billion-dollars-drift-to-determinism-dride-dej


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝26   💬2  
781
🥈
我愛JS
💬5  
16
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
🔧 阿川の電商水電行
Shopify 顧問、維護與客製化
💡
小任務 / 單次支援方案
單次處理 Shopify 修正/微調
⭐️
維護方案
每月 Shopify 技術支援 + 小修改 + 諮詢
🚀
專案建置
Shopify 功能導入、培訓 + 分階段交付