Janus-Pro 建立在 DeepSeek-LLM-7B 基礎上,是一個先進的多模態框架,旨在統一理解和生成任務。透過將視覺編碼分解為單獨的路徑,同時保持統一的轉換器架構,它解決了視覺理解和生成之間的衝突。 Janus-Pro 配備了用於圖像輸入的 SigLIP-L 視覺編碼器和用於圖像生成的高效標記器,在多模式基準測試中提供了高性能,超越了統一模型並有效地與特定於任務的方法競爭。它的簡單性、靈活性和強大的設計使其成為下一代視覺語言模型的有力競爭者。
擁抱臉
連結:https://huggingface.co/deepseek-ai/Janus-Pro-7B
GitHub
連結:https://github.com/deepseek-ai/Janus
本地安裝 DeepSeek Janus Pro 7B 的先決條件
確保您具有以下各項:
GPU:1xRTXA6000(用於流暢執行)。
磁碟空間:100 GB 可用。
RAM:64 GB(48 GB 也可以),但我們使用 64 GB 來確保流暢執行
CPU:64 核心(48 核心也可以),但我們使用 64 核心以確保執行流暢
本地安裝 NVIDIA SANA 模型的逐步過程
為了本教學的目的,我們將使用 NodeShift 提供的支援 GPU 的虛擬機器;但是,您可以與您選擇的任何其他雲端提供者複製相同的步驟。 NodeShift 提供最實惠的虛擬機,其規模符合 GDPR、SOC2 和 ISO27001 的要求。
造訪NodeShift 平台並建立一個帳戶。註冊後,登入您的帳戶。
按照帳戶設定流程提供必要的詳細資訊。
GPU 節點是 NodeShift 的 GPU 虛擬機,是配備了從 H100 到 A100 各種 GPU 的隨選資源。這些由 GPU 驅動的虛擬機器提供增強的環境控制,可根據特定要求調整 GPU、CPU、RAM 和儲存的配置。
導覽至左側的選單。選擇 GPU 節點選項,在儀表板中建立一個 GPU 節點,按一下建立 GPU 節點按鈕,然後建立您的第一個虛擬機器部署。
在「GPU 節點」標籤中,根據您的需求和想要啟動模型的地理區域選擇 GPU 模型和儲存。
在本教程中,我們將使用 1x RTX A6000 GPU 來實現最快的效能。但是,如果它更適合您的要求,您可以選擇更便宜且 VRAM 更少的 GPU。
有兩種可用的身份驗證方法:密碼和 SSH 金鑰。 SSH 金鑰是一個更安全的選擇。要建立它們,請參閱我們的官方文件。
接下來,您需要為您的虛擬機器選擇一個映像。我們將在 NVIDIA Cuda 虛擬機器上部署 DeepSeek Janus Pro 7B。這個專有的閉源平行運算平台將允許您在 GPU 節點上安裝 DeepSeek Janus Pro 7B。
選擇映像後,按一下「建立」按鈕,您的虛擬機器將被部署。
您將獲得視覺確認,表明您的節點已啟動並正在執行。
NodeShift GPU 可以透過使用在 GPU 建立期間提供的 SSH 金鑰連接到終端並透過終端進行控制。
一旦您的 GPU 節點部署成功建立並達到「正在執行」狀態,您就可以導覽至 GPU 部署執行個體的頁面。然後,點擊右上角的「連接」按鈕。
現在打開您的終端並貼上代理 SSH IP 或直接 SSH IP。
接下來,如果您想檢查 GPU 詳細訊息,請執行以下命令:
nvidia-smi
執行以下命令檢查可用的 Python 版本。
如果你檢查python的版本,系統預設有Python 3.8.1。要安裝更高版本的 Python,您需要使用 deadsnakes PPA。
執行以下命令來加入 deadsnakes PPA:
sudo apt update
sudo apt install -y software-properties-common
sudo add-apt-repository -y ppa:deadsnakes/ppa
sudo apt update
現在,執行以下命令來安裝 Python 3.11 或其他所需版本:
sudo apt install -y python3.11 python3.11-distutils python3.11-venv
現在,執行以下命令將新的 Python 版本連結為預設的 python3:
sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.8 1
sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.11 2
sudo update-alternatives --config python3
然後,執行以下命令來驗證新的 Python 版本是否處於活動狀態:
python3 --version
執行以下命令來安裝和更新 pip:
python3 -m ensurepip --upgrade
python3 -m pip install --upgrade pip
然後執行以下指令檢查pip的版本:
pip --version
執行以下命令克隆 DeepSeek Janus 儲存庫:
git clone https://github.com/deepseek-ai/Janus.git
cd Janus
執行以下命令安裝專案依賴項:
pip install -e .
執行以下命令安裝 gradio:
pip install -e .[gradio]
執行以下命令來執行伺服器:
python3 demo/app_januspro.py
透過以下地址存取應用程式:
在本地 URL 上執行:http://127.0.0.1:7860
在公共 URL 上執行:https://0fac078df655921b11.gradio.live
總而言之,DeepSeek Janus Pro 7B 是一個突破性的多模式框架,旨在統一和優化涉及多模式理解和文字到圖像生成的任務。透過利用其解耦的視覺編碼和統一的變壓器架構,它超越了傳統的統一模型,同時保持了不同應用所需的靈活性和簡單性。 Janus Pro 具有詳細的安裝指南和與高級 GPU 設定的兼容性,非常適合旨在探索多模式功能下一個前沿的研究人員和開發人員。其強大的性能和創新的設計使其成為未來視覺語言整合進步的有前途的工具。
原文出處:https://dev.to/nodeshiftcloud/how-to-install-deepseek-janus-pro-7b-locally-5924