我在科技社群裡最喜歡的部分就是開源專案的存在。
世界各地的人們為有價值的專案做出貢獻並免費提供這些專案,這真是太酷了。
在這篇部落格中,我們將介紹 11 個您現在應該查看的令人興奮的 GitHub 儲存庫。
讓我們立即開始吧!
Crawlee是一個網頁抓取和瀏覽器自動化庫。它可以幫助您建立可以抓取網站並提取資料的爬蟲。
當網站新增 JavaScript 渲染時,你不必重寫所有內容,只需切換到其中一個瀏覽器爬蟲。當您稍後找到一個可以加速爬行的優秀 API 時,請將開關撥回。
Crawlee 有三種類型的爬蟲類:
✅ Cheerio Crawler :這是一個簡單的 HTTP 爬蟲,使用Cheerio函式庫解析資料。
✅ Puppeteer Crawler :這是一個瀏覽器爬蟲,使用Puppeteer庫來呈現頁面並提取資料。
✅ Playwright Crawler :這是一個瀏覽器爬蟲,它使用Playwright庫來呈現頁面並提取資料。 Playwright 是 Puppeteer 更強大的繼任者。
除了抓取和自動化之外,他們還提供了許多工具以結構化的方式保存提取的資料。
Crawlee還可以用於許多實際用例,例如從電子商務網站抓取產品資料以及從電子表格中批量處理資料。
您可以在此處閱讀有關他們在實際用例中使用 Crawlee 的更多資訊。
Crawlee 是一個 Node.js 函式庫,因此您需要安裝 Node.js 才能開始使用。
它可透過 NPX 取得,因此您可以透過執行以下命令來啟動一個新專案:
npx crawlee create my-crawler
您可以選擇入門模板,然後按照說明開始操作。然後,您可以透過執行以下命令來執行爬蟲:
cd my-crawler
npm start
當 Crawlee 啟動時,你會在終端機中看到類似這樣的內容:
INFO PlaywrightCrawler: Starting the crawl
INFO PlaywrightCrawler: Title of https://crawlee.dev/ is 'Crawlee · Build reliable crawlers. Fast. | Crawlee'
INFO PlaywrightCrawler: Title of https://crawlee.dev/docs/examples is 'Examples | Crawlee'
INFO PlaywrightCrawler: Title of https://crawlee.dev/api/core is '@crawlee/core | API | Crawlee'
INFO PlaywrightCrawler: Title of https://crawlee.dev/api/core/changelog is 'Changelog | API | Crawlee'
INFO PlaywrightCrawler: Title of https://crawlee.dev/docs/quick-start is 'Quick Start | Crawlee'
Crawlee 還可用於許多其他地方,例如抓取用於建立 API 的資料、抓取用於電子表格的資料或抓取用於儀表板的資料。
它是抓取資料和自動化網頁瀏覽器的強大工具。他們的Github 儲存庫上已經有 16k+ 顆星。
請參閱 Crawlee官方文件以取得更多相關資訊。
https://git.new/Crawlee 給 Crawlee 一顆星 🌟
Encore是一個開源後端框架,用於使用 Go、JavaScript 和 TypeScript 等語言建立後端應用程式,現在也支援 AI 驅動的開發。
它專門設計用於與 GitHub Copilot 等 AI 工具配合使用,以產生完整的分散式系統。
它還檢查所有 AI 產生的程式碼,以確保它正確實現服務定義、API 規範和基礎設施整合。
使其非常適合 AI 開發的一些關鍵特性:
⚡️完整系統產生:AI工具可以準確產生具有多種服務的完整分散式系統
⚡️生產就緒驗證:自動驗證所有產生的程式碼的正確性
⚡️無知識差距:透過服務目錄、API 文件和架構圖自動提供文件和可觀察性
⚡️基礎設施即程式碼:AI 可以產生和驗證雲端基礎設施集成
<
視訊寬度=“600”控制>
您的瀏覽器不支援影片標籤。
該平台由 Rust 提供支援,速度極快 - 在基準測試中比 Express.js 快9 倍,比 Elysia 和 Hono 快3 倍。
透過執行以下命令安裝 Encore CLI:
brew install encoredev/tap/encore
上述命令適用於 macOS,但您可以在其他平台的官方文件中找到其安裝說明。
若要使用 AI 就緒範本建立新應用程式,請執行:
encore app create
選擇您喜歡的模板並按照說明開始。建立後,使用以下命令執行您的應用程式:
cd your-app-name
encore run
<
視訊寬度=“600”控制>
您的瀏覽器不支援影片標籤。
Encore提供了一個開發儀表板,您可以在其中監控您的應用程式、瀏覽 API 文件並即時視覺化您的架構。透過http://localhost:9400
造訪。
Encore 的Github 倉庫有8.7k+顆星,貢獻者超過 70 人,迅速成為 AI 驅動的後端開發的首選框架。
https://git.new/encore 給 Encore 一顆星 🌟
在當今的人工智慧時代,利用人工智慧管理這些龐大的管道非常麻煩。
Kitops就是解決這個問題的。它是一個管理 AI 管道的平台。
KitOps是一個開源 DevOps 工具,它將您的 AI/ML 模型、資料集、程式碼和配置打包並版本化為一個可重現的工件(稱為 ModelKit)。
ModelKits 基於現有標準建置,確保與資料科學家和開發人員已經使用的工具相容。
首先,請確保您已安裝 Kitops CLI 。
然後,建立一個新資料夾並導航到該資料夾:
mkdir my-kitops-project
cd my-kitops-project
Kitops CLI 將引導您完成建立新 Kitops 專案的過程。
檢查版本:
kit version
登入方式:
kit login jozu.ml
請按照本指南中的說明從 HuggingFace 取得範例 ModelKit 檔案。
與 ModelKit 相輔相成的是 Kitfile,這是一個基於 YAML 的配置文件,可簡化模型、資料集、文件、程式碼和配置的共用。
<
視訊寬度=“600”控制>
您的瀏覽器不支援影片標籤。
範例 Kitfile 如下所示:
manifestVersion: v1.0.0
package:
authors:
- Jozu
description: Updated model to analyze flight trait and passenger satisfaction data
license: Apache-2.0
name: FlightSatML
code:
- description: Jupyter notebook with model training code in Python
path: ./notebooks
model:
description: Flight satisfaction and trait analysis model using Scikit-learn
framework: Scikit-learn
license: Apache-2.0
name: joblib Model
path: ./models/scikit_class_model_v2.joblib
version: 1.0.0
datasets:
- description: Flight traits and traveller satisfaction training data (tabular)
name: training data
path: ./data/train.csv
- description: validation data (tabular)
name: validation data
path: ./data/test.csv
如您所見,這是一個簡單的 YAML 文件,用於指示 KitOps 捆綁什麼。這種配置與Docker中的Dockerfile
非常相似。
您可以在此處找到詳細的文件。
他們的社區仍在不斷發展,他們的Github 儲存庫上有600+顆星。
https://github.com/jozu-ai/kitops 給 Kitops 一顆星 🌟
Browserbase是一個平台,為您的 AI 應用程式和自動化需求提供可立即使用的 Web 瀏覽器。
Browserbase 的特別之處在於它可以輕鬆地與 Playwright、Puppeteer 或 Selenium 等流行工具配合使用。您不需要更改現有的程式碼 - 只需將其指向他們的瀏覽器就可以了!
該平台具有一些非常酷的功能:
超快:每個瀏覽器都有 4 個 vCPU,因此頁面載入速度很快
易於觀察:您可以即時查看瀏覽器正在做什麼
人工智慧友善:與人工智慧工具配合良好,並配有自己的框架 Stagehand
智慧保護:自動處理 CAPTCHA 並使用智慧代理來保持自動化執行
首先,安裝他們的 SDK(他們有 Node.js 和 Python 版本):
# For Node.js
npm install @browserbase/sdk
# For Python
pip install browserbase
這是一個使用其 Node.js SDK 的簡單範例:
import { Browser } from '@browserbase/sdk';
async function main() {
const browser = new Browser();
const page = await browser.newPage();
await page.goto('https://example.com');
await page.screenshot({ path: 'screenshot.png' });
await browser.close();
}
它們提供了一個遊樂場,您可以在執行腳本之前對其進行測試,它們的 AI 甚至可以幫助您編寫程式碼!
他們的Github 儲存庫正在快速成長,其主要專案Stagehand已擁有7.5k+ 顆星,該專案可協助您建立 AI 網頁瀏覽工具。
您可以在 Browserbase 的官方文件中了解有關其的更多資訊。
https://github.com/browserbase 給 Browserbase 一顆星 🌟
作為開發人員,我們都必須擁有一個漂亮的作品集來展示我們的工作。或者像我這樣的人可能需要一個部落格來記錄經驗和學習。
Astro 是一個靜態網站建立器,速度超快,而且 SEO 友好。
它支援多種框架,如 React、Vue 和 Svelte。它還支援 markdown 和 MDX。
Astro 隨附許多內建主題和元件。儘管你可以,但你永遠不必從頭開始。您可以在此處找到完整的主題清單。
要安裝 astro,請執行:
npm create astro@latest
或者您可以透過執行以下命令手動安裝 Astro:
npm install --save-dev astro
Astro 擁有龐大的社區,其Github 儲存庫上有49k+顆星。
您可以在 Astro 的官方文件中查看有關 Astro 的更多資訊。
https://github.com/withastro/astro 給 Astro 一顆星 🌟
Langchain 正在成為我進行每個 LLM 相關專案的首選。而且它是開源的,所以我更喜歡它。
Langchain 是一個用於建立 LLM 應用程式的框架。它提供的功能可協助您將 LLM 功能整合到文字以外的更多內容中。
它提供嵌入、向量儲存、鏈、代理等工具。
您可以使用 Langchain 建立強大的 RAG 管道和代理。 RAG 流程是使用 LLM 根據給定上下文回答問題的流程。
該上下文可以來自向量資料庫或簡單文字檔案。我們使用向量資料庫的原因是為了減少上下文視窗並提高結果的準確性。
Langchain 適用於 Python 和 JavaScript。
要安裝 Langchain,請執行:
pip install langchain
並使用 conda,
conda install langchain -c conda-forge
他們還提供了使用名為LangGraph的服務在雲端部署應用程式的工具。
他們的Github 儲存庫上有100k+顆星星。如果你還沒有使用它,那麼你應該使用它。
https://github.com/langchain-ai/langchain 給 Lanchain 一顆星 🌟
Bun 是一款專為提高速度而設計的一體化 JavaScript 執行階段和工具包,配有捆綁器、測試執行器和與 Node.js 相容的套件管理器。
Bun 的目標是與 Node.js 100% 相容。它是建立 Web 應用程式的絕佳工具。
它以名為bun
單一可執行檔形式發布。它是用 Zig 編寫的,並由 JavaScriptCore 提供支持,大大減少了啟動時間和記憶體使用量。
bun
命令列工具還實作了測試執行器、腳本執行器和與 Node.js 相容的套件管理器,所有這些都比現有工具快得多,並且幾乎不需要任何更改就可以在現有的 Node.js 專案中使用。
若要安裝 Bun,請執行:
curl -fsSL https://bun.sh/install | bash # for macOS, Linux and WSL
powershell -c "irm bun.sh/install.ps1|iex" # for Windows
Bun也提供了同時支援Linux x64和arm64架構的docker映像。
Bun 是一個套件管理器,支援模板、捆綁、測試等多種開箱即用的功能。
他們的Github 儲存庫上有76k+顆星星。
https://github.com/oven-sh/bun 給 Bun 一顆星 🌟
創造一個好的 UI 很難。幾乎每個人都相信的那句名言「後端實際上比前端更容易」實際上是正確的。
Shadcn在這裡幫助了我們。
Shadcn 是一個預先建置元件庫,您可以使用它來建立您的 UI。它通常與 Next.js 一起使用,但它們也支援其他框架,如 Vite、Remix、Astro 等。
最好的部分是您不必像在其他庫中那樣一次安裝所有元件。您可以隨時僅安裝所需的元件。
這就像說:“我想要一個按鈕,所以我將安裝按鈕元件並在我的應用程式中使用它。”您不必擔心樣式或實作細節。
他們還提供了很多模板來幫助您入門。您可以在此處找到模板清單。
要安裝 Shadcn(用於 Next.js),請執行:
npx shadcn@latest add
系統將提示您幾個問題,只需選擇您喜歡的選項即可。
完成!現在您可以開始為您的應用程式新增元件。
讓我們為我們的應用加入一個按鈕:
npx shadcn@latest add button
您將在專案中看到一個新檔案components/ui/button.tsx
。
您可以透過匯入它並像這樣使用它在您的應用程式中:
import { Button } from "@/components/ui/button"
他們的Github 儲存庫上有80k+顆星星。
https://github.com/shadcn-ui/ui 給 Shadcn 一顆星 🌟
Supabase是一個開源的 Firebase 替代品,支援 Postgres 資料庫來建立您的 Web、行動和 AI 應用程式。
Supabase 提供身份驗證、即時資料庫、即時 API、邊緣功能、即時訂閱、儲存和向量嵌入。
最好的部分是您可以免費使用它。他們提供了兩個免費專案來幫助您入門。
我在許多專案中都使用了 supabase。它很容易上手,提供身份驗證功能,並且還有很多其他有用的功能。
他們還提供了一些入門模板。您可以在此處找到所有模板的清單。他們有特定框架的模板、網路應用程式演示、行動應用程式演示等等。
入門非常簡單。只需在他們的網站上註冊並建立一個新專案。
那取決於你想做什麼了。您想實現身份驗證嗎?照這個,要使用資料庫嗎?照這個,想要使用儲存嗎?按照這個。
他們有一個CLI來幫助您入門。
他們的Github 倉庫有超過77k+顆星,它是建立你的下一個專案的絕佳工具。
查看官方文件以開始使用。
https://github.com/supabase/supabase 給 Supabase 一顆星 🌟
Remix是一個全端 Web 框架,讓您專注於使用者介面並透過 Web 標準進行工作以獲得快速、安全且高度互動的體驗。
Remix 建立在React-Router之上,有以下四個特點:
編譯器
伺服器端 HTTP 處理程序
伺服器框架
瀏覽器框架
Remix 特別的之處在於它專注於網路標準和現代 UX 模式。 Remix 不是建立靜態站點,而是利用分散式系統和原生瀏覽器功能來建立超快的互動式應用程式。
Remix 最酷的功能之一是巢狀路由。路線可以嵌套在其他路線內,並且每個路線都可以載入自己的資料。
若要建立新的 Remix 專案,請執行:
npx create-remix@latest
這將建立一個新的 Remix 專案,其中包含您開始所需的一切。您可以從不同的模板中進行選擇。
建立後,您可以啟動開發伺服器:
npm run dev
Remix 在其Github 儲存庫上擁有30k+顆星,並被 Shopify、Microsoft 和 GitHub 等公司使用。
您可以在 Remix 的官方文件中了解有關其的更多資訊。
https://github.com/remix-run/remix 給 Remix 一顆星 🌟
FastAPI是一個使用 Python 建立 API 的現代 Web 框架。它的設計目標是快速、易於使用且易於生產。
它使用 Python 的類型提示來自動驗證資料、產生文件並提供編輯器支援。這意味著您可以編寫更少的程式碼並儘早發現錯誤。
FastAPI 建立在兩個強大的庫之上:
Starlette :處理所有 Web 元件
Pydantic :負責資料驗證
若要安裝具有所有建議功能的 FastAPI,請執行:
pip install "fastapi[standard]"
透過建立一個名為main.py
的檔案來建立一個簡單的 API:
from fastapi import FastAPI
app = FastAPI()
@app.get("/")
def read_root():
return {"message": "Hello, World!"}
使用以下命令執行您的 API:
fastapi dev main.py
就是這樣!您的 API 現在正在 http://127.0.0.1:8000 執行。造訪http://127.0.0.1:8000/docs查看自動互動文件。
該框架也超級快 - 它是目前最快的 Python 框架之一,與 NodeJS 和 Go 的速度相當。
他們的Github 儲存庫上有80k+顆星星,並且開發者社群不斷壯大。
您可以在其官方文件中了解有關 FastAPI 的更多資訊。
https://github.com/fastapi/fastapi 給 FastAPI 一顆星 🌟
就此結束!這些是你絕對應該探索的 11 個頂級 GitHub Repos,以在 2025 年保持領先。
如果您發現這篇文章有用,請與您的同行和社群分享,以傳播有關這些不可思議的工具的資訊。
還有其他很棒的開源專案嗎?將它們發表在評論中——我很樂意聽到您的建議!
另外,關注我以獲取更多類似內容:
{% 嵌入https://dev.to/arindam_1729
如需付費合作,請發送電子郵件至: [email protected] 。
感謝您的閱讀!
原文出處:https://dev.to/arindam_1729/11-exciting-github-repositories-you-should-check-right-now-37cg