阿川私房教材:學程式,拿 offer!

63 個專案實戰,直接上手!
無需補習,按步驟打造你的面試作品。

立即解鎖你的轉職秘笈

簡介

透過這份備忘清單深入了解 Python,其中包含任何 Pythonista 都需要了解的唯一函式庫。

從資料操作到機器學習和建立 Web 應用程式,這些程式庫在您的 Python 編碼之旅中至關重要。

介紹 GIF


網路應用程式

Web 應用程式

1. 太皮

Taipy 是這個街區的新來者。

它專為輕鬆開發前端 (GUI) 和 ML/資料管道而設計。

建立您夢想的應用程式得益於:

  • 完整的客製化和互動

  • 多頁和多用戶應用程式

  • 管道圖形編輯器

  • 還有更多!


QueenB

您的支持意義重大🌱,並且在許多方面為我們帶來了很大的幫助,例如寫文章! 🙏


2. Streamlit

Streamlit 是一個完善的函式庫,可用於為飛行員快速建立 Web 應用程式。非常容易使用!


要點

要點

3. 熊貓

該庫帶來了兩個核心概念:資料幀和系列,使資料清理和準備成為一個輕鬆的過程。

4. Numpy

Pandas 有資料框,而 Numpy 有陣列。

它們以允許快速資料操作而聞名,使 Numpy 成為科學計算的重要工具。

5. 請求

該程式庫使處理 HTTPS 請求變得輕而易舉。

Requests 提供與 Web API 互動和管理 HTTP 回應的功能。

6. Scipy

Scipy 基於 Numpy,核心功能專注於數學計算,具有最佳化、訊號處理和插值等功能。


約會時間

日期時間

7. 日期時間

DateTime 是一個標準的 Python 函式庫,對於處理任何 DateTime 格式都是必不可少的。

8.

Pendulum 具有更高級的日期和時間處理所需的附加功能。

他們有更好的時區支援以及更好的格式選項。


機器學習

機器學習

9. Scikit-Learn

這個庫不再需要介紹了,這是理所當然的。

Scikit Learn 是機器學習的參考,包含從聚類到分類的演算法。

它還包括從資料驗證到資料選擇的所有功能。

10. XGboost

該庫以其回歸和分類演算法的高效結果而聞名。

11. Catboost

Catboost 是一個機器學習庫,專門設計用於處理主要顯示分類資料的資料集。


深度學習

深度學習

12. TensorFlow

TensorFlow 是一個成熟的深度學習庫,專門從事自然語言處理和影像分類。

13. PyTorch

Pytorch 還是 TensorFlow,這就是問題所在。

最終,您可以選擇自己的團隊,但 PyTorch 的與眾不同之處在於它更注重自然語言處理,並且更具 Python 風格,從而減少了眾所周知的 TensorFlow 陡峭的學習曲線。

14. Keras

Keras 是開始深度學習的好方法,因為它在 TensorFlow 之上執行,但實作過程得到簡化。

15. OpenCV

OpenCV 提供了各種圍繞即時電腦視覺的演算法。

您可以處理多種格式,包括物件、人類,甚至手寫體。


自然語言處理

NLP

16. NLTK

NLTK 是自然語言處理的首選函式庫。

NLTK 的主要功能包括:處理和操作文本(標記化、詞幹提取等)以及使用 NLP 任務進行分類以進行情緒分析。

17. SpaCy

是這個領域的新人,專注於讓 NLP 更容易存取和用戶友好。

該圖書館優化了流程,以確保更高的速度和效率。


測試

測試

18. Pytest

Pytest 是一個簡化測試編寫和執行的框架。它的語法簡潔,使用者友善。

19. Unitest

Unistest 是 Python 內建的測試框架。

其主要功能是:測試發現、夾具支援、輕鬆組織和測試套件管理。


聲音的

音訊

20. AudioFlux

Python 中用於音訊訊號處理的首選庫,但很簡單。

AudioFlux 具有大量功能,包括聲音分析,可用於深度學習訓練。

21. Librosa

此 Python 程式庫允許從音訊來源中分析和提取特徵。


程式碼分析

程式分析

22.黑色

它是一個自動程式碼格式化程式。

它將自動格式化您的程式碼,以在整個專案中保持一致的風格。

23. Pylint

顧名思義,Pylint 是一個 linter。

它是一個靜態程式碼分析工具,用於檢查程式碼品質和錯誤。

24. Flake8

這是另一個 linting 函式庫,可以根據 PEP8 編碼約定檢查您的程式碼。

25. Ruff

Ruff 是等效 linter 的最快選擇。

它提高了效率和速度,使流程加快了十倍。


分散式計算

分散式計算

26. Dask

Dask 是一個流行的分散式運算 Python 包,因為它在處理大型資料集時特別有用。

Dask 整合了 Pandas、Numpy 和 Scikit-learn API,因此易於使用。

27. PySpark

顧名思義,PySpark 是 Apache Spark 的 Python API,讓我們可以直接在 Python 中利用 Spark 的功能。

28. 極地

Polars 是一個為處理大型資料集而建立的 DataFrame 函式庫。

它的靈感來自蟒蛇皇室 - 熊貓,但有一個(快速)扭曲,它的速度快了 10 到 100 倍。


文件

文件

29. Mkdocs

Mkdocs 是產生簡單文件的最易於存取的庫。

適合較小的專案,幾乎沒有學習曲線。

30. 獅身人面像

Sphinx 通常是大型專案的首選。

它包括對多種格式的支援並允許特定的自訂。

31. Pydoc

Pydoc 已整合到 Python 生態系統中。它直接從您的模組產生文件。


地理資料

地理資料

32. Geopy

Geopys 的主要功能是:距離計算、地理編碼和反向地理編碼。

33.

該庫允許您使用 Python 建立互動式地圖。改變遊戲規則的人。

34. Geopandas

當您擁有地理空間資料時,您應該採取的方法。

如標題所述,Geopandas 是 Pandas,但用於地理空間資料。該庫具有輕鬆操作和分析地理資料的功能。


遊戲

遊戲

35. Pygame

Pygame 是首選、簡單的函式庫,可以輕鬆使用 Python 建立 2D 和互動式視訊遊戲。

36. 街機

就像 PyGame 一樣,Arcade 使 Python 中建立影片遊戲成為一個有趣的過程。

它們對經典 Pygame 進行了更現代的改造,因此選擇實際上取決於個人喜好。


網頁抓取

網路搜尋

37. Scrapy

Scrapy 是一個成熟的函式庫,以網頁抓取而聞名。

一些關鍵功能包括:支援非同步/同步操作、HTTPS 請求處理等。

它具有廣泛的功能,這可能證明該庫具有陡峭的學習曲線。

38. 美麗湯

Beautiful Soup 是您處理從 XML 和 HTML 檔案中提取資料所需的一切。

由於其 Python 風格,它受到了開發人員的讚賞。


視覺化

視覺化

39. Matplotlib

Matplotlib 是 Python 中主要的元件庫,這是有充分理由的。

Matplotlib 允許使用多種圖表類型繪製 2D 圖形,並且還允許進行大量自訂。

元素的細粒度控制是該庫的真正優勢。

40. 散景

與 Matplotlib 相反,Bokeh 專注於互動式圖表。

41. Seaborn

Seaborn 建構在 Matplotlib 之上。

雖然 Matplolib 強調精確性和簡單性,但 Seaborn 在建立複雜的統計視覺化的同時,其時尚的視覺效果具有真正的附加價值。

42. Vizzu

Vizzu 在視覺化領域找到了自己的定位,並且做得非常好。

他們將講故事和圖表與高度動畫的視覺化融為一體,這是一種獲得更多動態圖表的好方法。


結論

無論您是高級 Python 專家還是正在嘗試 Python,有了這份不可或缺的函式庫列表,您將能夠應對任何挑戰。祝你編碼愉快!


我是一名新手作家,歡迎任何改進建議!

新秀圖片

如果您有任何疑問,請隨時與我們聯繫。


原文出處:https://dev.to/taipy/top-42-python-libraries-you-need-to-know-1omo


共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。

阿川私房教材:學程式,拿 offer!

63 個專案實戰,直接上手!
無需補習,按步驟打造你的面試作品。

立即解鎖你的轉職秘笈