小編精選 - 技術文章翻譯 · 09月21日

2024 年你應該知道的 11 個開源 Python 專案🧑‍💻🪄

Python 是最容易上手的程式語言之一，幾乎可以應用於每一個技術領域——無論是資料科學、自動化、物聯網、人工智慧、機器學習還是網頁開發。而 Python 最有趣的地方在於它是 100% 開源 的，這使得它更具威力和活力。

然而，許多開發者在建構網頁應用程式時忽略了 Python，這限制了它的潛力。

在這篇文章中，我將介紹 11 個每位網頁開發者都應該關注的開源 Python 專案。

讓我們開始吧！🚀

Let's Go

Opal - 開放政策管理層

Opal Image

如果你是一名在大型專案中工作的網頁開發者，並且不同的團隊或用戶群體需要對敏感資料有不同的存取權限，那麼這可能會有些困難。如果這正是你的情況，Opal 將是你工作流程中的一大助力。

Opal 提供了一個簡單的方法來強制執行特定用戶的權限，確保正確的人能安全地存取正確的數據。它是一個用於管理政策的開源管理層，支持像 Open Policy Agent 這類的政策引擎，並幫助團隊定義存取控制流程。

Opal Github

Opal 讓網頁開發者能夠專注於構建功能，而它則負責處理複雜的權限問題，簡化了管理不同用戶角色的程式複雜性。

Opal 的核心功能都是即時權限，但這與網頁開發者有幾個關聯：

它能夠即時授權和撤銷權限，因此網頁開發者不需要手動更新應用中的用戶存取權。
它允許開發者用程式碼編寫政策，使其更容易版本管理、審核和管理。
可以輕鬆接入像 AWS 或 Kubernetes 這類的安全雲端服務微服務，方便進行安全的政策更新。

這個工具對任何希望在其專案或應用中包含即時權限更新的人來說都是完美的。你可以加入他們的 Slack 頻道，了解更多信息。

目前他們在 GitHub 上擁有超過 4k 顆星標，顯示出他們在社群中的支持和信任。你也可以通過為他們的專案加星來支持他們：

https://io.permit.io/se-opal 在 GitHub 上為他們加星 ⭐️

Taipy - 建立 Python 數據和 AI 網頁應用

Taipy Image

你是否曾想過不使用前端框架構建一個簡單的 AI 專案？如果是的話，這個工具就是為你而生。

Taipy 是一個用於創建基於數據或 AI 的網頁應用的工具，使用 Python 和現有模型。它是為需要快速視覺化數據的機器學習工程師和數據分析師、尋求簡便解決方案以建構完整專案的 Python 開發者，以及想要創建自定義數據儀表板的商業分析師而設計的。

Features

Taipy 使用 Python 命令創建組件、圖形界面和儀表板。它主要用於數據驅動的專案，並非常適合處理大型數據集。

Taipy 非常適合複雜的工作流程，提供節點以高效處理，並與 pandas 集成，使你可以直接在專案中操作數據。

https://github.com/Avaiga/taipy 在 GitHub 上為他們加星 ⭐️

Reflex - 使用純 Python 構建網頁應用

Reflex image

作為一名純 Python 開發者或者對前端開發毫無所知的後端開發者，我深知因為專案通常是全部程式碼且沒有用戶界面而無法展示的痛苦。如果你也是這樣，這個工具將會改變遊戲規則。

使用 Reflex，你可以使用純 Python 最簡單的方式構建互動式用戶界面，速度非常快；這樣有多酷呀！

GIF

這減少了學習最新、閃亮前端框架的需求；它處理用戶界面和伺服器邏輯。

這個工具通過用純 Python 構建組件來運作，與傳統的網頁開發不同，傳統的全棧應用有兩個獨立的應用：一個處理用戶界面，另一個處理伺服器邏輯或狀態管理。這可能是用於用戶界面的 React 和用於伺服器邏輯的 Flask。在 Reflex 中，一切都在一個代碼庫中構建，並可以存儲在一個專案文件中。

此外，你不需要學習如何在 Heroku、AWS 或 Azure 上部署。Reflex 提供了一個便利的方法，只需一個命令即可部署你的專案。

https://github.com/reflex-dev/reflex 在 GitHub 上為他們加星 ⭐️

Crawlee - 網頁爬蟲和瀏覽器自動化庫

Crawlee

網頁爬蟲非常有用，因為它可以讓你匿名從網站上收集大量數據，這對市場研究、商業分析、AI 訓練和競爭分析都有很大幫助。這主要是通過 Javascript 渲染或 HTTP 庫完成的。為了讓爬蟲變得簡單而有趣，Crawlee 就此推出。

Crawlee 是一個專注於讓任何開發者容易進行網頁爬蟲的工具。這是一個用 Python 構建的開源專案。Crawlee 最初是為 Typescript 開發者構建的，目前擁有 13k 顆星和超過 100k+ 下載量。

Crawlee for Python

Crawlee for Python 是為了讓 Python 中的網頁爬蟲變得非常簡單，與基本的 HTTP 爬蟲庫相比，Crawlee 提供了：

它支持 Beautiful Soup、HTTPX 和無頭瀏覽器如 Playwright，無論是否需要 Javascript 渲染都能抓取網站。
它使用代理輪換和會話管理，以幫助避免被網站封鎖，使其能輕鬆抓取具有反網路爬蟲措施的網站。
它基於 async io 构建，使其在 I/O 綁定操作或大型專案的爬取中表現出色。

https://github.com/apify/crawlee-python 在 GitHub 上為他們加星 ⭐️

Portkey AI Gateway - AI 應用控制面板

Portkey Ai Gateway

自從 ChatGPT 發布以來，AI 在幾乎每次技術對話中都成為熱議話題。幾乎很難找到一家初創公司不向其產品添加某些 AI 功能。對於一名嘗試探索當前 AI 市場的網頁開發者來說，但又不想為處理複雜的大型語言模型基礎架構而感到頭痛，這個工具可能正是你所需要的。

Portkey 是一個開源的 AI 網關，旨在讓整合大型語言模型（LLM）如 OpenAI、Phi-3 和 Anthropic 變得輕而易舉。它允許開發者快速構建 AI 驅動的功能，而不必面對 LLM 基礎架構的麻煩。

Portkey GitHub

AI 網關處理多個 AI 供應商的 API 呼叫，使得在模型之間切換、管理提示以及追踪性能變得簡單。此外，通過快取、負載平衡和重試等功能，它確保你的應用保持快速和可靠。

https://github.com/Portkey-AI/gateway
在 GitHub 上為他們加星 ⭐️

LLMware - 針對複雜企業的 AI

LLMware

如果我想學習如何構建和部署大型語言模型，LLMware 將是我的首選工具。它專為那些不需要深入理解 LLM，但仍然希望試驗的人設計。它提供了預先構建的 LLM 組件和可自定義的現成模型，讓我能迅速創建聊天機器人。

使用 LLMware，網頁開發者不需要從頭開始構建模型——他們可以專注於調整現有模型以滿足需求。LLMware 管理 LLM 的擴展和性能監控，讓我可以專注於構建 AI 驅動工具的創意部分。最棒的是，它提供了各種各樣的模型供你選擇。

LLMware

在構建你的下一個 AI 驅動專案時，考慮使用 LLMware 來處理模型的基礎架構，讓你可以專注於創建專案的互動方面。

LLMware 在 GitHub 上擁有超過 4.5k 顆星，因此它受到開源社群的廣泛支持。

https://github.com/llmware-ai/llmware
在 GitHub 上為他們加星 ⭐️

Beautiful Soup - 網頁爬蟲工具

Beautiful Soup

每位網頁開發者在其職業生涯中至少需要一次了解爬蟲的運作，因為它可以幫助你從網站上收集大量數據以進行研究。Beautiful Soup 是一個完美的工具，能做到這一點。

這是一個開源的 Python 庫，可使用解析器從 HTML 和 XML 網站或頁面中抽取數據。它有著獨特的搜索網站和修改數據的方法，可以節省你數小時的壓力和調試時間。

Python 中的每一個網頁爬蟲工具都因 Beautiful Soup 的美麗而存在，因此如果你需要構建自己的工具，可以考慮使用這個庫。

Gunicorn - 用於 UNIX 的 Python WSGI HTTP 伺服器

Gunicorn

Gunicorn，簡稱為 Green Unicorn，是許多 Python 開發者使用的 Python WSGI HTTP 伺服器，但它在運行網頁應用程式方面的真正價值經常被忽視。想像一下，你正在開發一個 Python 專案，需要流暢地同時處理多個用戶請求。Gunicorn 就會在此發揮其神奇的作用。它平穩地處理請求，因此你無需擔心伺服器管理。

這匹工作馬的主要亮點是 WSGI，即網頁伺服器閘道介面，它定義了網頁伺服器如何與網頁應用進行對話的流程。Gunicorn 是 Nginx 或 Apache 等網頁伺服器與 Django 和 Flask 等網頁應用之間的中介。

如果你打算使用 Python 框架構建全棧應用，則需要熟悉這個工具。它非常適合管理大型 Python 專案。

https://github.com/benoitc/gunicorn
在 GitHub 上為他們加星 ⭐️