Qoder 越來越猛了,Browser Use 讓 Agent 的聯網能力拉滿。

大家好,我是二哥呀。

最近,Qoder 系列產品的進化越來越讓人驚喜了!

尤其是它的 Browser Use 功能,讓 Agent 的聯網能力拉到滿中滿。

第一,Qoder 很早期的版本就內建了瀏覽器,並且支援開發者模式、元素選擇。

第二,幫 Qoder 安裝 Chrome DevTools MCP,對於不需要登入的瀏覽器操作會非常方便。

第三,安裝 QoderWork 的 Chrome 瀏覽器擴充功能,讓 Agent 像你一樣操作瀏覽器。完全和人操作瀏覽器的方式一模一樣。

上圖就是 QoderWork 自動在我的 Chrome 中打開技術派的 admin 頁面,並幫我進行 ElasticSearch 的關鍵字搜尋測試,關鍵字是【注意力機制】。

更重要的是:QoderWork for Chrome 不只是測試程式碼成果,還能協調多個 Agent 併行測試複雜的網頁互動場景,尤其是多人協作/多人在線應用這種人工測試比較麻煩的場景

我錄了個螢幕,大家可以感受下,非常無敵。

安裝方法、使用體驗、提示詞我也都會一一分享出來,按照我的步驟,你也可以肝出一個卡神的 AI Hot 網站。

調研階段,QoderWork for Chrome 擴充功能可以無限開分頁,哈哈。

仔細瞧瞧我的分頁,密密麻麻

01、安裝 QoderWork Chrome 擴充功能

四步搞定。

第一步,造訪 Chrome 線上應用程式商店,搜尋 QoderWork Browser Connector,或者直接打開這個連結:

第二步,點擊【加到 Chrome】,跳出確認對話框後選擇【新增擴充功能】。

第三步,回到 QoderWork,新開一個任務,點擊對話框中的【連接器】,啟用【我的瀏覽器】。

在設定的【連接器與 MCP】這裡就能看到已啟用的瀏覽器連接器了。

第四步,在 QoderWork 中新開一個任務,輸入你想讓 Agent 做的事情。注意看 Chrome 瀏覽器的分頁會出現一個 QW 圖示,頂部會顯示【QoderWork 瀏覽器連接器已開始偵錯此瀏覽器】的提示。

這表示連接成功了,Agent 現在能看到你的瀏覽器,也能操作它。

芜湖。

接下來,能做的事情就多了呀。

02、QoderWork Chrome 的工作原理

先說原理。

QoderWork for Chrome 和 Chrome DevTools MCP 有什麼差別?

表面上都是操作瀏覽器,底層邏輯完全不一樣。

Chrome DevTools MCP 是啟動一個獨立的 Chrome 執行個體,透過 CDP 協議遠端控制。這意味著它沒有你的登入狀態,存取需要驗證的頁面得重新登入。

(當然可以用 web-access 這種 Skill 來優化)

QoderWork for Chrome 是一個瀏覽器擴充功能,直接注入到你正在使用的 Chrome 裡面。

第一,從真實瀏覽器 DOM 取得完整頁面內容。不是從網路層攔截 HTML 原始碼,而是拿到 JavaScript 動態渲染完成之後的真實 DOM 樹。SPA 應用、動態載入的內容、延遲載入的圖片,全部可見。

第二,直接復用你 Chrome 的登入狀態和 Cookie。不管是技術派的 admin 後台、公司的 Jira、還是小紅書的個人首頁,只要你在 Chrome 裡登入過,Agent 直接就能存取,不需要任何額外驗證。

第三,操作方式完全模擬真人。navigate 導航、type 輸入、click 點擊、scroll 捲動、screenshot 截圖、upload 上傳檔案。所有互動都發生在真實的瀏覽器環境裡,網站的前端邏輯、事件監聽、狀態管理全部正常觸發。

看一個實際的 case。

我已經打開技術派的 admin 端並登入了,你幫我測試一下文章列表的 ElasticSearch 搜尋,關鍵字可以是注意力機制。

注意 Chrome 瀏覽器的分頁會出現一個 QW 圖示,並且頂部會出現【QoderWork 瀏覽器連接器已開始偵錯此瀏覽器】的提示。

如果發現問題,可以讓 QoderWork 幫你直接修改。

我搜的是注意力機制,為什麼第一個結果沒有這個關鍵字呢?另外,我不希望 markdown 格式的內容顯示在 table 中,會佔用很多空間,給使用者的感受很不友善。

注意這些細節,完全是按照人的方式在操作瀏覽器。

arduino 程式碼解讀複製代碼navigate → http://127.0.0.1:3301
type → 搜尋框 → “注意力機制”
click → 搜尋按鈕
screenshot → 儲存當前頁面截圖

每一步 Agent 都會先截圖觀察當前頁面狀態,辨識可互動的元素,然後執行操作,再截圖確認結果。這個「觀察-決策-執行-驗證」的迴圈,和人類操作瀏覽器的方式一模一樣。

問題解決後,自己再主動測試驗證結果,真的超級方便。

03、登入態小紅書場景實測

登入態復用是 QoderWork for Chrome 一個非常實用的能力。

要知道,小紅書是出了名的反爬大戶。WebFetch 去抓小紅書頁面,回來的要麼是空白、要麼是登入提示、要麼就是一堆被混淆的 JavaScript。

但 QoderWork for Chrome 不一樣。它用的就是我們日常的 Chrome,我的小紅書已經登入了。

我給 QoderWork 發了一條指令:

去小紅書搜尋“AI Agent”,看看最近有什麼熱門討論,整理前 10 條貼文的標題和核心觀點。

Agent 直接在我已登入的小紅書頁面上操作:打開搜尋框、輸入關鍵字、按下 Enter,然後逐條提取搜尋結果。

因為是登入狀態,搜尋結果和我自己搜的一模一樣,沒有任何限制。

更關鍵的是,Agent 不只是看標題。它會主動點進幾篇貼文,讀留言區的討論,提取使用者的真實回饋。

這種深度是搜尋引擎摘要給不了的。

整理完之後給了我一份報告:

所有需要登入才能看到內容的平台,同樣的邏輯。只要你在 Chrome 裡登入過,Agent 就能進去操作。

04、並行調研 GitHub AI Hot10

QoderWork 真正讓我覺得「不一樣」的,是它的 Multi-Agent 並行調研能力。

我最近有個想法:

每天整理一份「GitHub AI Hot10」排行榜,看看當天有哪些好玩的 AI 開源專案值得關注。手動做這件事太痛苦了,GitHub Trending 只有大類排行,我想要的是細分到 Agent 框架、RAG 工具、LLM 推理引擎、AI Coding 助手這些具體方向的精選。

於是我啟用了 QoderWork 的專家套件。

「專家套件」是 QoderWork 之前上的一個概念:把多個技能和連接器打包在一起,形成面向特定職務的完整能力。

我給 QoderWork 的任務描述是:

幫我調研 GitHub 上今天最熱門的 AI 開源專案,分成 5 個方向(多個並行的子 Agent):Agent 框架、RAG/檢索增強、LLM 推理引擎、AI Coding 工具、多模態應用。每個方向找 2 個最近一週 Star 成長最快的專案,整理專案名稱、Star 數、一句話描述、專案連結。

QoderWork 接到任務後,把任務拆成了 5 個並行的子 Agent。

每個子 Agent 各自開一個 Chrome 分頁,分別去 GitHub Trending 按不同的關鍵字和 Topic 篩選。

Agent-A 在分頁 1 搜尋「agent framework」,Agent-B 在分頁 2 搜尋「RAG retrieval」,Agent-C 搜「LLM inference」,Agent-D 搜「AI coding」,Agent-E 搜「multimodal」。

五個 Agent 同時工作,各自獨立,互不干擾。

每個子 Agent 不只是看 Trending 清單。它會點進專案首頁,看 README 的第一段描述,看最近一週的 Star 成長曲線,看最近的 commit 頻率判斷專案是否活躍。

這個調查是真的仔細啊,我的瀏覽器分頁真的快撐不住了。😄

由於子 Agent 之間上下文完全隔離,每個 Agent 的輸出品質不會因為前面的調研結果而產生偏向。

最後主 Agent 整合成一份結構化的「GitHub AI Hot10」報告。格式很清爽:方向、專案名稱、Star 數、一句話描述、連結。

專業,實在是專業。

這就是 Multi-Agent 併行分治的威力。

主 Agent 像團隊 leader 一樣分發任務,子 Agent 像調研員一樣各自執行,最後彙總成果。整個過程中主 Agent 不參與任何具體的瀏覽器操作,它只負責拆分和整合。

05、定時任務做成每日推送

我把上面的 GitHub AI Hot10 調研任務配置成了一個每天早上 8 點自動執行的定時任務。

我希望整理成 Skill,並做成定時任務,每天 8 點開始。

這是 QoderWork 產生的定時任務。

還有配套的 Skill。

Skill 裡定義好:調研的 5 個方向分別搜什麼關鍵字、進入專案首頁後提取哪些欄位、異常情況怎麼處理。

有了 Skill 之後,定時任務每天跑的就是一套固定的工作流程。

如果還想更進一步,可以把這個結果做成一個網站,大家以後也可以透過 aihot.paicoding.com 看到每天的 AI 開源熱門專案。

我希望將這個專案部署到伺服器,就用子網域 aihot.paicoding.com 我的伺服器位址可以參考 deploy-front.sh 就放在伺服器的 www/aihot 目錄下。

很快就搞定了,只需要在網域解析上加一條子網域記錄就可以了。

頁面結構很簡單:日期 → 5 個方向 → 每個方向 2 個專案 → 專案卡片(名稱、Star、描述、連結)。

OK,大家已經可以存取了,做個像卡神一樣的 AI 熱點網站是不是也非常快?

全程我們只手動配了一個子網域,QoderWork 幫我們全部搞定。

整條流程就是:QoderWork 定時任務觸發 → QoderWork Chrome 瀏覽器連接器 → Multi-Agent 併行調研 → 靜態頁面渲染 → 每日自動更新。

全程無人值守。

最花時間的,其實就是調研階段,Skill 我們隨後會進行迭代。

以後大家想知道 GitHub 上有什麼好的、新鮮出爐的 AI 開源專案,就很方便了。

06、IM 頻道推送結果

網站有了,但我希望每天能主動收到推送,而不是自己去刷頁面。

QoderWork 也支援 IM 接入,包括微信、釘釘、飛書等等。

拿微信來舉例,點擊【配置】,拿起手機,微信掃個碼就好了。

設定完成後,每天早上 8 點定時任務跑完 GitHub AI Hot10 調研,結果會自動推送到我的微信。

打開手機就能看到今天有哪些值得關注的 AI 專案,不用打開電腦,不用切換任何東西。

(用 QoderWork for Chrome 跑任務是最花時間,調研階段前面演示過了,這裡為了示範就跳過了,先測試一下 IM 是否接通)

微信已經收到通知了。

點開看一下。

手機端打開,也是完全沒有問題。

完全一站式搞定,只能說 QoderWork 還是太能打了。

從一個想法的萌芽,到產品的調研,到網站的上線,就沒有它搞不定的。

  • 設計 Multi-Agent 併行調研架構,將 5 個方向的 GitHub 專案調研任務拆分給獨立子 Agent,各自操作瀏覽器分頁並行執行
  • 基於 QoderWork 專家套件封裝「產品調研」工作流程,定義關鍵字策略、資料擷取規則和輸出格式規範,確保每日輸出品質一致
  • 配置 QoderWork 定時任務實現每日 8 點自動觸發,結合 IM 頻道將結構化報告推送到團隊釘釘群,全程無人值守
  • 利用 QoderWork Browser Connector 復用真實 Chrome 登入態,支援 GitHub 私有儲存庫和需要驗證的平台調研,解決傳統爬蟲的登入態難題
  • 設計子 Agent 上下文隔離機制,每個子 Agent 獨立管理瀏覽器分頁,避免併行調研時的資訊交叉污染

ending

回頭看,QoderWork for Chrome 讓我最興奮的不是某個單點能力。

單純的瀏覽器操控?市面上有很多工具能做。登入態復用?CDP Proxy 也能實現。

真正讓我覺得「這東西不一樣」的是:它把瀏覽器操作、Multi-Agent 併行、專家套件、定時任務、IM 頻道這些能力組合在一起之後,產生的化學反應。

單獨每一項都不算新鮮,但串起來之後就是一條完整的自動化工作流程。每天早上 8 點,5 個 Agent 同時出動,各自調研一個方向,30 分鐘後搞定報告,推送到微信。我睡醒打開手機就能看到今天有什麼好玩的 AI 專案。

QoderWork 做到了,記得勾選一下保持系統喚醒,這樣定時任務會到點啟用,電腦也不用 24 小時待機。

【好的 AI 不是你需要它的時候去找它,而是它每天準時出現在你的訊息列表裡。】

我們下期見。


原文出處:https://juejin.cn/post/7653331314107809846


精選技術文章翻譯,幫助開發者持續吸收新知。

共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。
🏆 本月排行榜
🥇
站長阿川
📝16   💬1   ❤️1
510
🥈
我愛JS
📝1   ❤️1
32
評分標準:發文×10 + 留言×3 + 獲讚×5 + 點讚×1 + 瀏覽數÷10
本數據每小時更新一次
📢 贊助商廣告 · 我要刊登