阿川私房教材:
學 JavaScript 前端,帶作品集去面試!

63 個專案實戰,寫出作品集,讓面試官眼前一亮!

立即開始免費試讀!

我們建立了pgai Vectorizer來簡化 AI 應用程式的嵌入管理——而無需單獨的資料庫或複雜的基礎設施。自推出以來,開發人員已經在 Timescale Cloud 上建立了超過 3,000 個向量化器,還有更多是自架的。

在 pgai Vectorizer 發布之後,我們收到了一些關於 X 的回饋。資料來源:Swyx、Franzipol、Ashwin 和 Ray Fernando

但是開發人員希望 pgai Vectorizer 能夠與熟悉的應用程式建立工具配合使用並支援更多的嵌入提供者。今天,我們透過兩項重要更新來實現這一目標:

  • SQLAlchemy 支援:最廣泛使用的 Python ORM,SQLAlchemy 允許您使用 Python 而不是原始 SQL 來處理資料庫。現在,pgai Vectorizer 直接集成,因此您可以像使用 SQLAlchemy 查詢任何其他列一樣儲存和查詢向量嵌入。

  • 透過 LiteLLM 實作更多嵌入模型: LiteLLM 為多個嵌入提供者提供了一個簡單的 API。現在,pgai Vectorizer 可透過單一 SQL 指令與 OpenAI、Cohere、Hugging Face、Mistral、Azure OpenAI、AWS Bedrock 和 Google Vertex 搭配使用。

這些更新使得使用 Python 中的嵌入變得更簡單、更靈活 - 沒有額外的複雜性,只是適合您現有堆疊的工具。

(更多關於我們為何建構 pgai Vectorizer 的資訊:向量資料庫是錯誤的抽象。)

SQLAlchemy:像其他欄位一樣儲存和查詢向量

SQLAlchemy 是一個抽象 SQL 查詢的 Python ORM,現在與 pgai Vectorizer 集成,允許您像任何其他資料庫列一樣儲存和查詢嵌入 - 而無需編寫原始 SQL。

  • 像任何其他列一樣嵌入和檢索向量:將嵌入定義為模型內的結構化欄位。

  • 在 ORM 表達式內執行向量相似性查詢:無需原始 SQL 或外部向量儲存。

  • 使用 Alembic 遷移:保持架構變更的版本控制。

這使得在 Postgres 內部儲存、檢索和更新嵌入變得更加容易,同時保持所有內容都是 ORM 原生的。

op.create_vectorizer(
    source="blog",
    embedding=OpenAIConfig(
        model='text-embedding-3-small',
        dimensions=768
    ),
    chunking=CharacterTextSplitterConfig(
        chunk_column='content',
    ),
    formatting=PythonTemplateConfig(template='$title - $chunk')
)

LiteLLM:使用單一 SQL 指令交換嵌入提供者

選擇正確的嵌入模型會影響成本、效能和準確性——但切換提供者不應該需要重寫查詢。 LiteLLM 透過使用單一 SQL 命令實現無縫提供者交換來消除這種摩擦(無需重寫查詢,無需手動重新處理)。

  • 立即切換供應商:以最少的努力測試 OpenAI、Cohere、Hugging Face、Mistral、Azure OpenAI、AWS Bedrock 和 Google Vertex。

  • 無查詢重寫:無論嵌入提供者是誰,應用程式都能繼續運作。

  • 切換時保留舊嵌入:確保平穩過渡而無停機。

SELECT ai.create_vectorizer(
    'my_table'::regclass,
    embedding => ai.embedding_litellm(
        'cohere/embed-english-v3.0',
        1024,
        api_key_name => 'COHERE_API_KEY'
    ),
    chunking => ai.chunking_recursive_character_text_splitter('contents')
);

LiteLLM 現已可供自架用戶使用,並且即將登陸Timescale Cloud

幾分鐘內即可開始

Pgai Vectorizer 的 SQLAlchemy 和 LiteLLM 整合現已推出,使得在 Postgres 內部儲存、查詢和試驗向量嵌入變得前所未有的簡單。

立即嘗試

對於自託管部署,需要外部工作人員來處理嵌入。在 Timescale Cloud 中,這可以自動處理 API 呼叫並動態擴展工作負載。

下一步是什麼?

Pgai Vectorizer 只是一個開始。我們正在建立更廣泛的 AI 原生資料庫體驗,其中 Postgres 支援更智慧的索引、高級 AI 搜尋以及與 AI 工具的更深層次的整合。期待更多的增強功能,使 Postgres 成為建立 AI 應用程式的最佳場所。

加入我們的 Discord 社群來分享回饋並了解其他人正在建立什麼。


原文出處:https://dev.to/timescale/pgai-vectorizer-sqlalchemy-and-litellm-make-vector-search-simple-29mp


共有 0 則留言


精選技術文章翻譯,幫助開發者持續吸收新知。

阿川私房教材:
學 JavaScript 前端,帶作品集去面試!

63 個專案實戰,寫出作品集,讓面試官眼前一亮!

立即開始免費試讀!