TL;DR
Anthropic 最近發表了〈When AI Builds Itself〉,這篇文章在解釋 AI 如何越來越多地協助打造下一代 AI。如今,Anthropic 產線程式碼中有超過 80% 是由 Claude 撰寫,而工程師推出的程式碼量大約是 2024 年的八倍。
我帶著和許多開發者現在可能一樣的那種安靜焦慮讀了這篇文章。讀完之後,我反而沒那麼害怕了。
不是因為數字很小。其實並不小。
而是因為讀完整篇文章後,我意識到 AI 變強的地方,並不是讓開發者有價值的那個地方。執行變得更快、更便宜;但判斷力——也就是決定什麼值得做、結果是否真的合理、以及何時該質疑答案而不是直接接受——並沒有。這個差異在網路上大多數討論裡都被忽略了,而一旦你看見這點,整篇文章的讀法就完全不同了。
如果你想先讀原文再看我的想法,這裡是連結:Anthropic 的〈When AI Builds Itself〉。
在過去幾個月裡,我大概讀了幾百篇關於 AI 取代開發者的文章。
有些很有見地;有些很明顯只是為了吸引點擊。但過了一陣子,它們開始混在一起,我注意到一件有趣的事。
最吵的那些觀點,幾乎從來不是來自真正討論原始資料的人。它們來自轉述再轉述的摘要、推文截圖,或是只抓一個數字當標題、卻把上下文全部拿掉的文章。
所以當 Anthropic 發表〈When AI Builds Itself〉時,我決定直接把整篇讀完,而不是等別人幫我解釋。
我原本以為自己會更擔心。結果讀完後,我反而覺得網路上的討論比文章本身誇張太多了。
那些數字是真的。速度是真的。Anthropic 這類公司內部正在發生的改變也是真的。這些都不該被忽略。這不代表這篇文章本身就讓人安心。有些數字確實驚人。但整體圖像比網路上常講的要細緻得多。
這不是要把每一頁都濃縮成摘要。它只是我讀完這篇文章後,對 AI 與軟體工程之間那場討論的看法如何改變。
在進入正文前,有一個背景值得先提。Anthropic 發表這篇文章,不是為了預測未來某一天軟體工程會變成什麼樣子;而是為了說明,當 AI 成為他們開發流程中更大的一部分時,他們在自己工程與研究團隊裡已經看見了什麼。這個區別很重要。這篇文章大多是在描述他們已經觀察到的變化,而不是單純希望會發生的變化。
我原本沒預期的是,這篇文章花在未來預測上的篇幅其實很少。相反地,它一開始先往回看。
作者回顧了 AI 是怎麼逐漸進入 Anthropic 自己的工程工作流程,而這段脈絡很重要,因為它會改變你讀後面所有內容的方式。這篇文章不是在說「這是未來某天可能發生的事」,而是在說「我們是怎麼走到這一步的」。
在 2021 到 2023 年左右的早期,情況和一般軟體公司差不多。工程師寫程式、審查 Pull Request、修 Bug,並做技術決策。那時候 AI 還沒有真正成為開發流程的一部分。
後來,它開始協助處理較小的任務。一開始,這很像我們今天很多人使用 AI 的方式:產生函式、解釋一段程式碼、建議重構。工程師仍然主導每一步,而 AI 比較像是坐在編輯器旁邊的另一個工具。
到了 2025 年左右,這種關係開始改變。Claude 不再只是提出程式碼建議,而是開始處理整個工作流程中更大的部分。它可以寫檔案、執行檔案、檢查輸出、修正錯誤,然後在真人介入前重複這個循環好幾次。工程師的角色並沒有消失,但他們需要親手做的實作工作量,已經開始改變。
根據這篇文章,到 2026 年時,這些工作流程變得更加自主。AI 代理可以連續工作更長時間,而且在某些情況下,還能和其他代理協同工作。
文章中的一個例子,讓這段演進更容易想像。一次例行性的軟體升級,意外導致數萬個 AI 訓練工作失敗。工程師給 Claude 存取環境,並附上一些問題脈絡。大約兩個小時內,Claude 找出一個罕見的設定旗標,正是它導致失敗的原因,驗證修復方式,並解決了問題。作者表示,若由同樣資深的工程師來調查,可能需要兩到三天。
這類故事本身就很驚人,但它們還只是單一案例。真正說服我的是,文章拿資料來支持這些故事。那些數字顯示,這不只是一次偶發成功,而是公司內部更大幅度轉變的一部分。
在談這一切代表什麼之前,值得先看看數字本身。它們很容易被誇大,也很容易被輕描淡寫。這兩種反應都不太有幫助。
最醒目的統計,可能你已經在社群媒體上看過了。Anthropic 表示,截至 2026 年 5 月,其併入正式產線程式碼庫的程式碼中,有超過 80% 是由 Claude 撰寫。這個比例在 2025 年初 Claude Code 上線前,還只有個位數的低端。
生產力上的影響也看得出來。工程師現在合併的程式碼量,大約是 2024 年的八倍。根據文章,這是兩次明顯跳升的結果。第一次,是 Claude 不再只是提出程式碼,而是開始執行它。第二次,則是 AI 代理變得能夠長時間自主工作。
研究端也呈現類似趨勢。Anthropic 公布了一項針對約 130 位研究員的內部問卷結果。中位數回應是:使用 AI 時,他們感覺自己的產出大約是不用 AI 時的四倍。
能力基準測試也快速前進。有一項基準是衡量 AI 系統是否能成功重現已發表研究論文的結果。據報成功率從 2024 年的約 20% 升到僅僅十五個月後幾乎接近滿分。另一項指標則估算 AI 能可靠地獨立完成真實世界任務多久;根據文章,這段時間大約每四個月就會翻倍,從只需幾分鐘的任務,成長到可持續約十二小時的任務。
這些數字確實很驚人。讓我對它們更有信心的,是作者對自身限制的坦率。他們一再指出自己量測上的缺口。程式碼行數並不是完美的生產力指標。問卷回覆可能高估實際生產力提升。基準測試也不一定能完整反映真實工程工作中會發生的事。
這反而讓資料更有說服力。它比較不像行銷,反而像是一個團隊在努力解釋自己在組織內部真切看見了什麼。
這篇文章最重要的部分,出現在所有數字之後。讀完後,我腦中浮現的是一個更簡單的問題。
如果 Claude 寫了大部分程式碼,那工程師在做什麼?
至少依我對這篇文章的理解,答案是:開發者的工作不是消失,而是在改變。
Claude 已經變得非常擅長執行。只要給它一個定義明確的任務、足夠的上下文,以及正確的工具,它就能非常快速地推進實作。它可以寫程式碼、跑實驗、除錯、測試不同方案,並且在重複性的工程工作上,比人快上很多。
但軟體工程從來不只是寫程式碼。
還是得有人決定哪些問題值得解決。還是得有人在實驗 technically 成功、但其實回答錯問題時,察覺出來。還是得有人看到一個看起來正確的結果,進一步問:它在整個系統裡真的合理嗎?這些決策比程式碼行數或基準分數更難量化,但文章暗示,這些仍然是工程師創造價值的重要部分。
作者甚至試著測量其中一部分。他們檢視真實研究過程中,人類做出一個後來被證明低效或直接錯誤的決策的案例。接著,他們把當時之前的所有資訊都給 Claude,並問它下一步會怎麼做。到了 2025 年末,他們最好的模型在選擇較佳下一步這件事上,約有 51% 的正確率;而幾個月後,這個數字升到了約 64%。
這是很有意義的進步。但同時也代表,模型在每個情境下都還不是都能選對方向。對於更開放式的決策,仍然有明顯落差。
文章中的一個比較,幫助我把這件事放回脈絡裡。作者描述工程師隨著經驗增加,責任如何改變。職涯早期時,大部分工作是在實作別人已經定義好的任務;隨著經驗增加,會開始負責決定這些任務該怎麼做,最終甚至要先判斷哪些問題值得注意。
我不認為這個比較的意思是:AI 只是取代初階工程師,而資深工程師毫髮無傷。軟體工程沒那麼整齊,AI 也不是。這個比較想表達的是,當實作變得更容易時,理解系統、評估取捨、審查成果與做出好決策的能力,會變得更加重要。
這也是我讀完這篇文章後最大的收穫。
我不覺得這場討論真正是在談「開發者會不會變得不必要」。它其實是在談:當軟體工程中某一部分突然變得快很多時,工作的重心會怎麼改變。這比把一切簡化成「AI 寫了大部分程式碼」更有用。
我知道身邊很多人都真的很擔心 AI。有時候這種擔心來自社群媒體,有時候來自研討會的演講,有時候只是因為這些工具進步得太快了。當你讀到世界上最領先的 AI 公司之一,其產線程式碼有超過 80% 是 AI 寫的,很難不開始想:那其他人還剩下什麼?
我也有過這些想法。讀這篇文章並沒有讓那些問題消失,但它確實改變了我看待它們的方式。
對我來說,最大的差別在於:我不再只盯著那個數字本身。80% 聽起來很驚人,直到你開始問:那 80% 到底代表什麼?這篇文章讓我意識到,我過去多半是用「寫了多少程式碼」來衡量軟體工程,但實際上,有些最有價值的工作,是在任何人打開編輯器之前就已經發生了。觀點的轉換,讓這篇文章感覺起來不再像是替代的故事,而更像是工作流程改變的故事。
我越想這件事,就越想起我們為什麼要花那麼多時間學習電腦科學基礎。當你在學作業系統、網路、資料庫、演算法或分散式系統時,很容易懷疑自己什麼時候才會真的用到這些內容。和做應用程式或交付功能比起來,它們會顯得很抽象。但這些主題教的不只是語法或 API。它們教你如何推理系統。教你如何思考取捨、理解複雜度、找出瓶頸,並解釋為什麼某件事會這樣運作。當實作變得更容易時,這些能力反而更有價值,因為它們能幫助你判斷實作是否真的正確。
那一刻,我的看法真的改變了。開發者被取代的恐懼,往往來自於把「寫程式」想成整份工作的全部。但軟體工程從來就不是那樣。寫程式很重要,但理解問題、設計系統、審查方案、與其他工程師溝通,以及在沒有明確答案時做決策,也同樣重要。
我現在還在職涯早期,我知道更有經驗的人會有不同看法。那完全合理。這只是我在仔細讀完這篇文章,而不是被標題牽著走之後,得到的結論。
這篇文章避開了一件我在很多 AI 討論中常看到的事。網路上常把 AI 講得好像只有兩種可能:不是一夜之間全面改變,就是什麼都沒真正改變。這篇文章採取了更穩健的方式。它列出幾種可能方向,而且坦白承認,沒有人能百分之百確定我們正走向哪一條路。
第一種可能是,如今快速的進展最終開始放慢。每項技術都會在某個地方遇到極限,可能來自硬體、能源、資料、研究挑戰,或只是剩下的問題變得難解許多。Anthropic 承認有這種可能,但根據他們目前掌握的證據,他們還沒看到那種極限出現。從他們追蹤的不同能力指標來看,曲線仍朝同一方向前進。這不代表進步會永遠以同樣速度持續,只是代表目前還沒有看見足以令人信服的放緩跡象。
這是我覺得最可信的情境,部分原因是它不需要從我們今天的位置跳躍太遠。這篇文章並沒有主張開發者會突然消失,或 AI 會在一夜之間接管軟體工程。它描繪的是一個未來:AI 逐漸成為工作流程中更大的一部分,而人們仍持續做那些需要上下文、經驗與責任的決策。
在過去兩年左右,AI 已經成為許多開發者工作流程中的另一個工具。我們用它來解釋不熟悉的程式碼、寫測試、產生樣板碼、除錯,或幫助我們從不同角度思考問題。這些都沒有讓開發者變得不需要。若要說有什麼影響,那就是它改變了我們把時間花在哪裡。我們以前也看過這種轉變。高階程式語言沒有消滅程式設計師,只是把工作往上一層抽象。AI 接手更多重複性的實作工作,看起來也是同樣類型的轉變,而不是另一種完全不同的事。
<a id="recursive-self-improvement"></a>
最後一種可能,也是最吸引注意力的那一種。這個概念是指,AI 最終會強大到足以對 AI 研究做出大量貢獻,讓每一代新模型都能在幾乎沒有太多人類介入的情況下,幫助打造更好的下一代。進步將不再那麼依賴人類研究投入,而更多取決於可用的算力、基礎設施與資源。
文章認真討論了這種可能,但也很謹慎地沒有把它說成必然結果。仍然有很多未知數,而作者也坦白承認,他們不知道這個時點何時會到來,甚至不確定它是否會到來。我覺得這種坦率讓文章更可信。科技很容易寫出聳動預測;但要承認仍存在的不確定性,反而難得多。
當我開始讀〈When AI Builds Itself〉時,我以為自己是在回答一個問題:AI 真的會取代開發者嗎?
但讀到文章結尾時,我發現自己其實開始問的是另一個問題:當 AI 成為開發流程的一部分時,軟體工程會怎麼改變?
這是完全不同的兩個討論。一個主要由恐懼驅動;另一個則由好奇心驅動。這種觀點上的轉換,大概是我讀完這篇文章後最大的收穫。
Anthropic 公布的數字都是真的,而且很難忽視。它們的產線程式碼現在有超過 80% 是 Claude 寫的。工程師推出的程式碼量,比兩年前大幅增加。AI 系統也正在變得能獨立工作更長時間。這一切都不像炒作。
但這篇文章讀起來,也不像網路上常把它講成的那樣。全文中,作者反覆承認不確定性。他們談到量測的限制。他們討論多種可能的未來,而不是硬說只有一條必然道路。他們非常小心地區分:哪些是他們已經觀察到的,哪些只是他們認為接下來可能發生的事。
在讀這篇文章之前,我多半是在回應標題、短影片,以及那些只抓單一統計數字、卻沒什麼脈絡的貼文。讀原文並沒有讓所有疑慮消失,但它把很多模糊的焦慮,換成了更清楚的理解:到底哪些正在改變,哪些又仍然充滿不確定。
我現在還在職涯早期,所以我不會假裝自己什麼都知道。也許五年後回頭看,我會發現自己低估了 AI 對軟體工程的影響。也許我會發現自己當時擔心得太多。現在的我,老實說還不知道。
但我確實知道的是:直接讀原文,和讀別人對它的解讀,感受很不一樣。如果要用一句話總結我從這篇文章帶走了什麼,那就是:被自動化掉的,不是我正在努力變強的那項能力。
寫這篇文章的過程,逼著我放慢速度,重新思考自己很多焦慮到底從哪裡來。對我來說,問題其實不全是科技本身,而是那一波又一波告訴我「這項科技到底意味著什麼」的標題,卻沒鼓勵我去看原始來源。
讀完這篇文章後,我覺得自己更清楚看見機會與不確定性了。我還是對 AI 感到興奮,也還是對它的走向保持謹慎。但我不再覺得這兩種感受一定互相矛盾。
我很想知道你的想法。如果你也讀過這篇文章,你的結論和我一樣嗎?還是有什麼完全不同的地方讓你印象最深?如果你也還在職涯早期,AI 是否改變了你對成為軟體工程師的想法?如果你在這個產業待得更久,我也特別想聽聽你從自己的角度怎麼看這些改變。
歡迎在下方留言。我會一則一則看,也很想繼續聊下去。
| 地點 | 在這裡找我 |
|---|---|
| GitHub | 實作一些東西 → hemapriya-kanagala |
| 資源與更新 → hemapriya-kanagala | |
| X | 隨手的開發想法 → @KanagalaHema |
透明說明: 本文的橫幅圖片是使用 DEV Community 內建的 AI 圖像生成功能產生的。我撰寫提示詞,生成了多個變體,並選出本文使用的最終圖片。