Gemini CLI是由Google Gemini團隊開發的開源命令列 AI 工具,專為開發者設計。它可以理解程式碼、執行複雜查詢、自動執行任務,並利用 Gemini 的多模態功能(例如影像辨識)來產生創意內容。
GitHub: https://github.com/google-gemini/gemini-cli
主要特點:
大型程式碼庫支援:處理上下文中超過 100 萬個標記,從而可以輕鬆分析大型專案。
多模式應用程式原型設計:從 PDF 或草圖快速產生應用程式原型。
自動化 DevOps 任務:執行 Git 操作、取得 PR、建立遷移計畫等。
工具整合:透過 MCP 伺服器連接到 Imagen、Veo 和 Lyria 等媒體生成模型。
網路搜尋就緒:內建 Google 搜尋確保提供最新、可靠的回應。
確保已安裝Node.js 18 或更高版本。你可以執行以下命令進行檢查:
node -v
本指南以macOS為例,但 Windows 上的步驟類似 - 一切都在終端機中進行。
npx https://github.com/google-gemini/gemini-cli
在終端機中執行以下命令(如果使用sudo
,可能會提示您輸入系統密碼):
sudo npm install -g @google/gemini-cli
安裝完成後,只需在終端機中輸入gemini
即可啟動互動式 CLI。首次執行時,它可能會請求一些權限——只需確認即可繼續。
啟動後,CLI 將引導您完成以下步驟:
從提供的選項中選擇您喜歡的主題樣式。按Enter確認。
選擇登入方式。我們推薦「使用 Google 登入」 ,該方式每分鐘最多可免費要求 60 次,每天最多可免費請求 1,000 次。選擇該方式並按Enter 鍵。
如果您需要更高的速率限製或企業存取權限,則可以使用 API 金鑰:
從Google AI Studio取得您的 API 金鑰。
將其設定為環境變數:
export GEMINI_API_KEY="YOUR_API_KEY"
注意:API 金鑰通常用於直接 API 呼叫-本指南重點介紹 CLI 體驗。您可以閱讀以下指南以了解更多關於 Gemini API 的資訊:指南:什麼是 Google Gemini API 以及如何使用它?
選擇登入方式後,將開啟一個瀏覽器視窗。只需使用您的 Google 帳戶登入即可。
一旦通過身份驗證,您將看到如下確認訊息:
現在,您可以直接在 CLI 中輸入提示符號。例如:
若要上傳和引用本機文件,請在 CLI 中使用@
來觸發文件選擇:
嘗試在 VSCode 的整合終端中直接執行gemini
。之後,使用@
指令選擇一個檔案並開始對話。
例如:
幫我寫一個簡單的計算器
CLI 可能會在此過程中要求「寫入權限」—只需確認即可。結果如下(略顯醜陋):
如果您的連線不穩定,Gemini CLI 可能會自動從gemini-2.5-pro
機型回退到更快的gemini-2.5-flash
機型。
若要發現可用的命令和使用技巧,請在 CLI 中鍵入/
。
Gemini CLI是開發人員、DevOps 工程師和資料分析師的強大 AI 伴侶。它簡化了程式碼分析,自動化了工作流程,並支援創意生成——所有這些都透過自然語言指令實現。
除了 Gemini CLI 之外,還有另一個強大的開發人員生產力工具: Apidog 。
Apidog 是一個集API 文件、 API 偵錯、 API 設計、 API 測試、模擬和自動化於一體的平台。它簡化了您的整個 API 工作流程,使其成為提高開發效率的最佳工具之一。
如果您正在積極建立和測試 API,不妨試試 Apidog。註冊很簡單——只需在此註冊即可。
註冊後,您可以探索官方的演示專案。這些示範專案經過精心設計,可以幫助您快速掌握 Apidog 的核心功能。
Apidog 的一大優勢在於它完全相容於Postman和Swagger格式。如果您之前使用過這些工具,那麼匯入現有資料將非常輕鬆。其直覺的介面也使其對初學者友好——即使是初次使用的用戶也能快速上手。
原文出處:https://dev.to/auden/google-gemini-cli-tutorial-how-to-install-and-use-it-with-images-4phb