過去十年來,人工智慧世界取得了長足發展。

人工智慧無所不在,從語音助理到軟體開發,如果我們正確使用它,它會非常有幫助。

在這樣的世界中,製作 AI 應用程式是有利可圖的,因此我在這裡介紹 25 個開源專案,您可以使用它們來製作 AI 應用程式並將其提升到新的水平。

其中有一些令人興奮的概念,例如使用語音合成與 3D 角色進行互動式溝通。堅持到底。

將會有大量的資源、文章、專案想法、指南等可供參考。

讓我們涵蓋這一切!


1. Taipy - 將資料和人工智慧演算法整合到生產就緒的 Web 應用程式中。

打字

Taipy 是一個開源 Python 庫,可用於輕鬆的端到端應用程式開發,具有假設分析、智慧管道執行、內建調度和部署工具。

我相信你們大多數人都不明白 Taipy 用於為基於 Python 的應用程式建立 GUI 介面並改進資料流管理。

因此,您可以繪製資料集的圖表,並使用類似 GUI 的滑桿來提供使用其他實用功能來處理資料的選項。

雖然 Streamlit 是一種流行的工具,但在處理大型資料集時,其效能可能會顯著下降,這使得它在生產級使用上不切實際。

另一方面,Taipy 在不犧牲性能的情況下提供了簡單性和易用性。透過嘗試 Taipy,您將親身體驗其用戶友好的介面和高效的資料處理。

在底層,Taipy 利用各種函式庫來簡化開發並增強功能。

圖書館

開始使用以下命令。

pip install taipy

我們來談談最新的Taipy v3.1 版本

最新版本使得在 Taipy 的多功能零件物件中可視化任何 HTML 或 Python 物件成為可能。

這意味著FoliumBokehVega-AltairMatplotlib等程式庫現在可用於視覺化。

這也帶來了對Plotly python 的原生支持,使繪製圖表變得更加容易。

陰謀蟒蛇

他們還使用分散式運算提高了效能,但最好的部分是 Taipy,它的所有依賴項現在都與 Python 3.12 完全相容,因此您可以在使用 Taipy 進行專案的同時使用最新的工具和程式庫。

您可以閱讀文件

例如,您可以看到聊天演示,它使用 OpenAI 的 GPT-4 API 來產生對您的訊息的回應。您可以輕鬆更改程式碼以使用任何其他 API 或模型。

聊天演示

另一個有用的事情是,Taipy 團隊提供了一個名為Taipy Studio的 VSCode 擴充功能來加速 Taipy 應用程式的建置。

太皮工作室

您也可以使用 Taipy 雲端部署應用程式。

如果您想閱讀部落格來了解程式碼庫結構,您可以閱讀 HuggingFace 的使用 Taipy 在 Python 中為您的 LLM 建立 Web 介面

嘗試新技術通常很困難,但 Taipy 提供了10 多個演示教程,其中包含程式碼和適當的文件供您遵循。

例如,一些現場演示範例:

Taipy 在 GitHub 上有 7k+ Stars,並且處於v3版本,因此它們正在不斷改進。

利桑·阿爾·蓋布

https://github.com/Avaiga/taipy Star Taipy ⭐️


2. Supabase - 開源 Firebase 替代品。

蘇帕貝斯

要建立AI應用程式,您需要一個後端,而Supabase作為優秀的後端服務提供者可以滿足這一需求。

開始使用以下 npm 指令 (Next.js)。

npx create-next-app -e with-supabase

這就是使用 CRUD 操作的方式。

import { createClient } from '@supabase/supabase-js'

// Initialize 
const supabaseUrl = 'https://chat-room.supabase.co'
const supabaseKey = 'public-anon-key'
const supabase = createClient(supabaseUrl, supabaseKey)

// Create a new chat room
const newRoom = await supabase
  .from('rooms')
  .insert({ name: 'Supabase Fan Club', public: true })

// Get public rooms and their messages
const publicRooms = await supabase
  .from('rooms')
  .select(`
    name,
    messages ( text )
  `)
  .eq('public', true)

// Update multiple users
const updatedUsers = await supabase
  .from('users')
  .eq('account_type', 'paid')
  .update({ highlight_color: 'gold' })

您可以閱讀文件

您可以使用身份驗證、即時、邊緣功能、儲存等功能建立一個速度極快的應用程式。 Supabase 涵蓋了這一切!

Supabase 也提供了幾個入門套件,例如Nextjs 與 LangChainStripe 與 NextjsAI Chatbot

Supabase 在 GitHub 上擁有超過 63,000 顆星,並且擁有大量提交超過 27,000 次的貢獻者。

https://github.com/supabase/supabase 明星 Supabase ⭐️


3. Chatwoot - 即時聊天、電子郵件支援、全通路服務台並擁有您的資料。

查特伍德

Chatwoot 連接流行的客戶溝通管道,如電子郵件、網站即時聊天、Facebook、Twitter、WhatsApp、Instagram、Line 等。這有助於您從單一儀表板跨管道提供一致的客戶體驗。

這在各種情況下都可能很重要,例如當您圍繞人工智慧應用程式建立社群時。

聊天特烏功能

您可以閱讀文件來發現各種整合選項,以便更輕鬆地管理整個生態系統。

他們在每個整合中都有非常詳細的文件和快照範例,例如帶有 WhatsApp Cloud API 的 WhatsApp 通道。您可以根據需要一鍵式或自架部署到 Heroku。

他們在 GitHub 上擁有 18k+ Stars,並且發布了v3.6版本。

https://github.com/chatwoot/chatwoot 明星 Chatwoot ⭐️


4. CopilotKit - 在數小時內為您的產品提供 AI Copilot。

副駕駛套件

您可以使用兩個 React 元件將關鍵 AI 功能整合到 React 應用程式中。它們還提供內建(完全可自訂)Copilot 原生 UX 元件,例如<CopilotKit /><CopilotPopup /><CopilotSidebar /><CopilotTextarea />

開始使用以下 npm 指令。

npm i @copilotkit/react-core @copilotkit/react-ui @copilotkit/react-textarea

這是整合 CopilotTextArea 的方法。

import { CopilotTextarea } from "@copilotkit/react-textarea";
import { useState } from "react";

export function SomeReactComponent() {
  const [text, setText] = useState("");

  return (
    <>
      <CopilotTextarea
        className="px-4 py-4"
        value={text}
        onValueChange={(value: string) => setText(value)}
        placeholder="What are your plans for your vacation?"
        autosuggestionsConfig={{
          textareaPurpose: "Travel notes from the user's previous vacations. Likely written in a colloquial style, but adjust as needed.",
          chatApiConfigs: {
            suggestionsApiConfig: {
              forwardedParams: {
                max_tokens: 20,
                stop: [".", "?", "!"],
              },
            },
          },
        }}
      />
    </>
  );
}

您可以閱讀文件

基本概念是在幾分鐘內建立可用於基於 LLM 的全端應用程式的 AI 聊天機器人。

https://github.com/CopilotKit/CopilotKit Star CopilotKit ⭐️


5. DALL·E Mini - 根據文字提示產生圖像。

從文字生成圖像

OpenAI 擁有第一個令人印象深刻的模型,用於使用 DALL·E 生成圖像。

Craiyon/DALL·E mini 嘗試使用開源模型重現這些結果。

如果您想知道這個名字,DALL-E mini 應母公司的要求更名為 Craiyon,並以更易於存取的網路應用程式格式使用類似的技術。

您可以在Craiyon上使用該模型。

蠟筆

開始使用以下命令(用於開發)。

pip install dalle-mini

您可以閱讀文件

您可以閱讀DALL-E Mini 解釋來了解有關資料集、架構和所涉及演算法的更多資訊。

您可以閱讀最佳真實感 AI 圖像和提示的終極指南,以便更好地理解優質資源。

DALL·E Mini 在 GitHub 上擁有 14k+ Stars,目前處於v0.1版本。

https://github.com/borisdayma/dalle-mini 明星 DALL·E Mini ⭐️


6. Deepgram - 將語音 AI 建置到您的應用程式中。

深度圖

從新創公司到 NASA,Deepgram API 每天都用於轉錄和理解數百萬分鐘的音訊。快速、準確、可擴展且經濟高效。

它為開發人員提供語音到文字和音訊智慧模型。

深度圖選項

儘管他們有免費增值模式,但免費套餐的限制足以讓您入門。

可視化效果更上一層樓。您可以檢查即時串流媒體回應或音訊檔案並比較音訊的智慧程度。

串流媒體

情緒分析

您可以閱讀文件

您也可以閱讀 Deepgram 撰寫的關於如何將語音辨識新增至您的 React 和 Node.js 專案的範例部落格。

如果您想嘗試 API 來親自了解模型的靈活性,請查看他們的API Playground

https://github.com/deepgram 明星 Deepgram ⭐️


7. InvokeAI - 領先的穩定擴散模型創意引擎。

呼叫人工智慧

關於

InvokeAI 是 Stable Diffusion(開源文字到圖像和圖像到圖像生成器)的實現。

它可以在 Windows、Mac 和 Linux 機器上執行,並在 RAM 低至 4 GB 的 GPU 卡上執行。

此解決方案提供業界領先的WebUI,支援透過CLI進行終端使用,並作為多種商業產品的基礎。

呼叫ai

您可以閱讀有關安裝和硬體要求如何安裝不同型號以及最重要的自動安裝的資訊

令人興奮的功能是能夠使用另一個圖像生成圖像,如文件中所述。

InvokeAI 在 GitHub 上有近 21k 顆星,

https://github.com/invoke-ai/InvokeAI 明星 InvokeAI ⭐️


8. OpenAI - 您所需要的一切。

開放人工智慧

Gemini by Google 和 OpenAI 非常受歡迎,但我們在此列表中專注於 OpenAI。

如果您想了解更多訊息,可以在 Medium 上閱讀Google AI Gemini API in web using React 🤖 。這很簡單,也很切中要害。

透過 OpenAI,您可以使用 DALL·E(根據文字描述建立原創、逼真的圖像和藝術)、Whisper(語音辨識模型)和 GPT-4。在評論中告訴我們關於索拉的事吧!

您可以使用簡單的 API 開始建置。

completion = openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "What are some famous astronomical observatories?"}
  ]
)

您可以閱讀文件。它提供瞭如此多的選項來建立非常酷的東西!

文件概述

甚至 Stripe 也使用 GPT-4 來改善使用者體驗。

例如,您可以建立Assistant 應用程式並查看API 遊樂場以更好地理解它。

GPT-3

如果您需要指南,可以閱讀 Dzone 的Integrating ChatGPT With ReactJS

其間,OpenAI收購了Sora,獲得了壟斷地位。你怎麼認為?

https://github.com/openai 明星 OpenAI ⭐️


9. DeepFaceLab - 用於建立深度贗品的領先軟體。

深臉實驗室

DeepFaceLab 是製作 Deepfakes 的頂級開源工具。

Deepfakes 是透過深度學習製作的經過修改的圖像和影片。它們經常被用來交換圖片或剪輯中的臉孔,有時是為了開玩笑,但也有出於有害的原因。

DeepFaceLab,用Python建置,是一個強大的deepfake工具。它可以改變媒體中的臉孔,甚至消除皺紋和老化跡象。

這些是您可以使用 DeepFaceLab 執行的一些操作。

  • 換臉。

更換臉部

圖片描述

  • 更換頭部。

更換頭部

  • 操縱嘴唇。

您可以使用這個基本教學來了解如何有效地使用 DeepFaceLab來完成這些事情。

您可以在YouTube上看到使用此 DeepLab 演算法的影片。

不幸的是,DeepFaceLab 中沒有「讓一切正常」按鈕,但值得根據您的特定需求了解其工作流程。

儘管它於 2023 年 11 月 9 日存檔,在 GitHub 上有近 44k+ 顆星,但由於其大量的教程和可靠的演算法,它仍然是您的 AI 應用程式的可靠選擇。

https://github.com/iperov/DeepFaceLab 明星 DeepFaceLab ⭐️


10. Detectron2 - 基於 PyTorch 的模組化物件偵測庫。

探測器2

Detectron2 是 Facebook AI Research 的下一代函式庫,提供最先進的偵測和分割演算法。它是 Detectron 和 maskrcnn-benchmark 的後繼者。

它支援 Facebook 上的多個電腦視覺研究專案和生產應用程式。

使用此YouTube 教學將 Detectron2 與 Facebook 開發者倡導者的機器學習結合使用。

Detectron2 旨在支援各種最先進的物件偵測和分割模型,同時也適應不斷發展的前沿研究領域。

您可以閱讀如何入門以及 元博客,其中深入介紹了 Detectron 的目標。

舊版的 Detectron 使用的是 Caffe,因此很難與後來結合 Caffe2 和 PyTorch 的程式碼變更一起使用。為了回應社群回饋,Facebook AI 發布了 Detectron2 作為更新的、更容易使用的版本。

Detectron2 配備了用於物件偵測的先進演算法,例如 DensePose 和全景特徵金字塔網路。

此外,Detectron2 還可以進行語義分割和全景分割,這有助於更準確地偵測和分割影像和影片中的物件。

Detectron2 不僅支援使用邊界框和實例分割遮罩進行物件偵測,還可以預測人體姿勢,與 Detectron 類似。

它們在 GitHub 儲存庫上擁有 28k+ Stars,並在 GitHub 上被 1.6k+ 開發人員使用。

https://github.com/facebookresearch/detectron2 Star Detectron2 ⭐️


11.FastAI-深度學習庫。

你真好

Fastai 是一個多功能的深度學習庫,旨在滿足從業者和研究人員的需求。它為從業者提供了高級元件,以便他們在常見的深度學習任務中快速獲得一流的結果。

同時,它為研究人員提供低階元件來實驗和開發新方法。

Detectron2 透過其分層架構實現了易用性和靈活性之間的平衡。

該架構將複雜的深度學習技術分解為可管理的抽象,簡潔地利用了 Python 的動態特性和 PyTorch 的靈活性。

它建構在較低層級 API 的層次結構之上,這些 API 提供可組合的建構塊。這樣,想要重寫部分高級 API 或加入特定行為以滿足其需求的用戶無需學習如何使用最低級別。

架構API

安裝 pyTorch後即可開始使用以下命令。

conda install -c fastai fastai

您可以閱讀文件

它們針對初學者、中級和專家的教程有不同的起點。

如果您想為 FastAI 做出貢獻,您應該閱讀他們的程式碼風格指南

如果您更喜歡影片,可以在 YouTube 上觀看傑里米霍華德 (Jeremy Howard) 撰寫的課程“0”:程式設計師實用深度學習 (fastai)

它們在 GitHub 上擁有超過 25,000 顆星,並已被 GitHub 上超過 16,000 名開發人員使用。

https://github.com/fastai/fastai 明星 FastAI ⭐️


12.穩定擴散- 潛在文字到影像擴散模型。

穩定擴散

什麼是穩定擴散?

穩定擴散是指生成模型中使用的一種技術,特別是在文字到圖像合成的背景下,其中將資訊從文字描述轉移到圖像的過程是逐漸且平滑地完成的。

在潛在文字到影像擴散模型中,穩定擴散可確保來自文字描述的訊息在整個模型的潛在空間中一致地擴散或傳播。這種擴散過程有助於產生與給定文字輸入相符的高品質和逼真的圖像。

穩定的擴散機制確保模型在生成過程中不會出現突然的跳躍或不穩定。我希望這能解決問題!

下載和採樣穩定擴散的簡單方法是使用擴散器庫

# make sure you're logged in with `huggingface-cli login`
from torch import autocast
from diffusers import StableDiffusionPipeline

pipe = StableDiffusionPipeline.from_pretrained(
  "CompVis/stable-diffusion-v1-4", 
  use_auth_token=True
).to("cuda")

prompt = "a photo of an astronaut riding a horse on mars"
with autocast("cuda"):
    image = pipe(prompt)["sample"][0]  

image.save("astronaut_rides_horse.png")

您可以閱讀研究論文以及有關穩定擴散影像修改的更多資訊。

例如,這是輸入。

輸入

這是放大一點後的輸出。

輸出

Stable Diffusion v1 是一種特定的模型配置,它採用 860M UNet 和 CLIP ViT-L/14 文字編碼器進行擴散模型,並具有下採樣因子 8 自動編碼器。該模型在 256x256 影像上進行了預訓練,隨後在 512x512 影像上進行了微調。

他們在 GitHub 儲存庫上擁有大約 64k+ Stars。

https://github.com/CompVis/stable-diffusion 恆星穩定擴散 ⭐️


13. Mocap Drones - 用於房間規模追蹤的低成本動作捕捉系統。

動作捕捉無人機

該專案需要 SFM(運動結構)OpenCV 模組,這需要您從原始程式碼編譯 OpenCV。

computer_code目錄中,執行此命令來安裝節點相依性。

yarn install

yarn run dev // to start the web server.

您將獲得前端介面的 URL 視圖。

開啟一個單獨的終端機視窗並執行命令python3 api/index.py來啟動後端伺服器。此伺服器負責接收攝影機串流並執行動作捕捉計算。

架構如下。

建築學

您可以觀看此YouTube 影片來了解 Mocap 無人機的工作原理,也可以觀看該專案所有者的部落格

https://www.youtube.com/watch?v=0ql20JKrscQ

您可以閱讀文件

這是一個最近的開源專案,在 GitHub 儲存庫上擁有 900 多個 star。

https://github.com/jyjblrd/Mocap-Drones 明星動捕無人機 ⭐️


14. Whisper Speech - 透過反轉 Whisper 建構的文字轉語音系統。

低聲講話

該模型與穩定擴散類似,但用於語音,功能強大且高度可自訂。

該團隊確保使用經過適當許可的語音錄音,並且所有程式碼都是開源的,使該模型對於商業應用程式來說是安全的。

目前,這些模型是在英語 LibreLight 資料集上進行訓練的。

您可以進一步研究架構

建築學

您可以聽到範例聲音並使用colab自行嘗試。

它們相當新,在 GitHub 上有大約 3k+ 的星星。

https://github.com/collabora/WhisperSpeech 星語語音 ⭐️


15. eSpeak NG - 支援一百多種語言和口音的語音合成器。

電子說

eSpeak NG 是一款緊湊型開源軟體文字語音合成器,適用於 Linux、Windows、Android 和其他作業系統。它支援 100 多種語言和口音。它基於 Jonathan Duddington 建立的 eSpeak 引擎。

您可以閱讀各種系統上的安裝指南

對於類似 Debian 的發行版(例如 Ubuntu、Mint 等)。您可以使用此命令。

sudo apt-get install espeak-ng

您可以查看支援的語言清單、閱讀文件並查看功能

該模型將文字轉換為音素程式碼,表明其作為另一個語音合成引擎前端的潛在能力。

他們在 GitHub 上有 2700+ 顆星星,

https://github.com/espeak-ng/espeak-ng 明星 eSpeak NG ⭐️


16.聊天機器人 UI - 每個模型的人工智慧聊天。

圖片描述

我們都使用過 ChatGPT,這個專案可以幫助我們為任何 AI 聊天機器人設定使用者介面。少一麻煩!

你可以閱讀安裝指南來安裝 docker、supabase CLI 和其他東西。

您可以閱讀文件並查看演示

這在底層使用了 Supabase (Postgres),這就是我們之前討論它的原因。

我沒有討論 Vercel AI 聊天機器人,因為它與此機器人相比是一個相當新的比較。

Chatbot UI 在 GitHub 上擁有大約 25k+ Stars,因此它仍然是開發人員為任何聊天機器人建立 UI 介面的首選。

https://github.com/mckaywrigley/chatbot-ui 明星聊天機器人 UI ⭐️


17. GPT-4 & LangChain - 用於大型 PDF 文件的 GPT4 和 LangChain 聊天機器人。

聊天架構

這可用於新的 GPT-4 API 來為多個大型 PDF 檔案建立 chatGPT 聊天機器人。

該系統是使用 LangChain、Pinecone、Typescript、OpenAI 和 Next.js 建構的。 LangChain 是一個簡化可擴展 AI/LLM 應用程式和聊天機器人開發的框架。 Pinecone 用作向量存儲,用於以文字格式儲存嵌入和 PDF,以便以後檢索類似文件。

您可以閱讀涉及複製、安裝依賴項和設定環境 API 金鑰的開發指南

您可以觀看YouTube 影片,了解如何遵循和使用它。

他們在 GitHub 上擁有 14k+ Stars,僅提交了 34 次。在您的下一個人工智慧應用程式中嘗試!

https://github.com/mayooear/gpt4-pdf-chatbot-langchain 明星 GPT-4 和 Langchain ⭐️


18. Amica - 允許您在瀏覽器中輕鬆與 3D 角色聊天。

朋友

Amica 是一個開源接口,用於透過語音合成和語音辨識與 3D 角色進行互動式通訊。

您可以匯入 VRM 文件,調整聲音以適合角色,並產生包含情緒表達的回應文字。

他們使用 Three.js、OpenAI、Whisper、Bakllava 等進行視覺處理。您可以閱讀Amica 的工作原理及其所涉及的核心概念

您可以克隆該存儲庫並使用它來開始

npm i

npm run dev

您可以閱讀文件並查看演示,這真是太棒了:D

示範

您可以觀看這段簡短的影片,了解它的功能。

https://www.youtube.com/watch?v=hUxAEnFiXH8

Amica 使用 Tauri 建立桌面應用程式。別擔心,我們在此清單的後面部分介紹了金牛座。

他們在 GitHub 上有 400 多個 Star,看起來非常容易使用。

https://github.com/semperai/amica Star Amica ⭐️


19. Hugging Face Transformers - 適用於 Pytorch、TensorFlow 和 JAX 的最先進的機器學習。

擁抱變形金剛臉

Hugging Face Transformers 可以輕鬆存取最先進的預訓練模型和演算法,用於文字分類、語言生成和問答等任務。該庫建置在 PyTorch 和 TensorFlow 之上,允許用戶以最少的努力將高級 NLP 功能無縫整合到他們的應用程式中。

憑藉大量預訓練模型和支援社區,Hugging Face Transformers 簡化了基於 NLP 的解決方案的開發。

這些模型可用於執行 100 多種語言的文本相關任務,例如文字分類、資訊擷取、問答、摘要、翻譯和文字生成。

它們還可以處理與影像相關的任務,例如影像分類、物件偵測和分割,以及與音訊相關的任務,例如語音辨識和音訊分類。

他們還可以執行各種模式的多任務處理,包括表格問答、光學字元辨識、從掃描文件中提取資訊、視訊分類和視覺問答。

您可以看到大量可用的模型

您可以瀏覽文件以取得完整的目標並向您展示可以執行的各種任務的範例。

例如,使用管道的一種方法是用於影像分割。

from transformers import pipeline

segmenter = pipeline(task="image-segmentation")
preds = segmenter(
    "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"
)
preds = [{"score": round(pred["score"], 4), "label": pred["label"]} for pred in preds]
print(*preds, sep="\n")

Transformer 得到了 Jax、PyTorch 和 TensorFlow 這三個最廣泛使用的深度學習庫的支持,並且它們之間可以無縫整合。這種整合可以使用一個庫輕鬆訓練模型,然後加載它們以使用另一個庫進行推理。

它們在 GitHub 上擁有大約 120k+ 星,並被 142k+ 大量開發人員使用。試試看!

https://github.com/huggingface/transformers 明星抱臉變形金剛 ⭐️


20. LLAMA - LLaMA 模型的推理程式碼。

來電

Llama 2 是 Facebook Research 開發的尖端技術,使個人、創作者、研究人員和各種規模的企業能夠使用大型語言模型負責任地實驗、創新和擴展他們的想法。

最新版本包括模型權重以及預訓練和微調 Llama 語言模型的起始程式碼,參數範圍從 7B 到 70B。

開始使用涵蓋以下步驟的安裝指南

  • 克隆並下載儲存庫。

  • 安裝所需的依賴項。

  • 從 Meta 網站註冊並下載模型。

  • 執行提供的腳本來下載模型。

  • 使用提供的命令在本地執行所需的模型。

您可以觀看由 ZeroToMastery 製作的關於什麼是美洲駝的YouTube 影片

您也可以在Hugging FaceMeta 官方頁面上查看型號清單和更多資訊。

Ollama 基於 llama,在 GitHub 上擁有 50k+ star。請參閱文件並使用此模型進行更多研究。

https://github.com/facebookresearch/llama 明星 LLAMA ⭐️


21. Fonoster - Twilio 的開源替代品。

福諾斯特

Fonoster Inc. 研究了一種創新的可編程電信堆棧,該堆疊將為企業提供完全基於雲端的實用程序,將電話服務與網路連接起來。

根據您想要實現的目標,有多種開始方法。

開始使用以下 npm 指令。

npm install @fonoster/websdk
// CDN is also available

例如,您可以透過以下方式將 Fonoster 與 Google Speech API 結合使用。 (您將需要服務帳戶的金鑰)

npm install @fonoster/googleasr @fonoster/googletts

這是您可以配置語音伺服器以使用插件的方法。

const { VoiceServer } = require("@fonoster/voice");
const GoogleTTS = require("@fonoster/googletts");
const GoogleASR = require("@fonoster/googleasr");
const voiceServer = new VoiceServer();
const speechConfig = { keyFilename: "./google.json" };

// Set the server to use the speech APIS
voiceServer.use(new GoogleTTS(speechConfig));
voiceServer.use(new GoogleASR(speechConfig));

voiceServer.listen(async(req, res) => {
  console.log(req);
  await res.answer();
  // To use this verb you MUST have a TTS plugin
  const speech = await res.gather();

  await res.say("You said " + speech);
  await res.hangup();
});

您可以閱讀文件

他們提供了一個足以入門的免費套餐。

他們在 GitHub 上擁有大約 6k+ 顆星,並發布了 250 多個版本。

https://github.com/fonoster/fonoster 明星 Fonoster ⭐️


22. DIPY - Python 中的 paragon 3D/4D+ 成像庫。

下降

DIPY 是 Python 中領先的 3D/4D+ 成像庫。它包含用於空間歸一化、訊號處理、機器學習、統計分析和醫學影像視覺化的各種方法。

此外,它還包含計算解剖學的專門方法,包括擴散、灌注和結構成像。

您可以開始使用。

pip install dipy

// run this in python console
import dipy
print(dipy.get_info())

如果您使用的是 anaconda 或其他系統,您可以閱讀完整的安裝指南

您可以閱讀文件並存取他們的YouTube 頻道

你可以看看詳細的例子

例子

他們的下載量超過 428k,並且在 GitHub 儲存庫上擁有 600 多個 Star。

https://github.com/dipy/dipy 明星 DIPY ⭐️


23. Elastic Search - 免費開放式、分散式、RESTful 搜尋引擎。

彈性搜尋

資料擬合

Elasticsearch 是一種分散式、RESTful 搜尋和分析引擎,能夠解決大量使用案例。

作為 Elastic Stack 的核心,它集中儲存您的資料,以實現閃電般的快速搜尋、微調的相關性以及可輕鬆擴展的強大分析。

他們闡述了使用 ElasticSearch 的用例。

用例

Elasticsearch 使用標準 RESTful API 和 JSON。我們也使用多種語言(例如 Java、Python、.NET、SQL 和 PHP)來建立和維護客戶端。

該結構如下。

const { Client } = require('@elastic/elasticsearch')
const client = new Client({ node: 'http://localhost:9200' })

client
  .search({
    index: 'social-*',
    body: {
      query: { match: { message: 'myProduct' } },
      aggs: {
        top_10_states: {
          terms: { field: 'state', size: 10 }
        }
      }
    }
  })
  .then(({ body }) => {
    const { hits } = body.hits
    console.log(hits)
  })
  .catch(console.error)

您可以閱讀文件並查看功能清單

儘管具有有用的功能,Elastic Search 的主要缺點是缺乏免費套餐。但是,您仍然可以利用免費試用版來探索和了解開源專案的架構。

Elastic Search 在 GitHub 上擁有超過 67k+ 的星星和近 1900 名貢獻者,並且處於v8版本中,正在不斷發展和改進。

https://github.com/elastic/elasticsearch 明星 Elastic Search ⭐️


24. Tauri - 使用 Web 前端建立更小、更快且安全的桌面應用程式。

困難

Tauri 是一個工具包,旨在幫助開發人員利用幾乎任何可用的前端框架為主要桌面平台建立應用程式。其核心是使用 Rust 開發的,而 CLI 利用 Node.js,提供了一種真正的多語言方法來開發和維護卓越的應用程式。

Tauri 應用程式中的使用者介面目前利用 Tao 作為 macOS、Windows、Linux、Android 和 iOS 上的視窗處理庫。

為了渲染您的應用程式,Tauri 使用 WRY,這是一個為系統 Web 視圖提供統一介面的程式庫。它在 macOS 和 iOS 上利用 WKWebView、在 Windows 上利用 WebView2、在 Linux 上利用 WebKitGTK 以及在 Android 上利用 Android System WebView。

您可以使用 Vite、HTML/CSS/JS、Next.js、Svelte 等等。

開始使用以下 npm 指令。

npm create tauri-app@latest

您可以閱讀文件並查看 Tauri 提供的功能清單

您甚至可以使用 Tauri 建立自己的 CLI,這有多酷:)

團隊提供了YouTube 影片,讓您了解更多關於 Tauri 的訊息。

他們在 GitHub 上擁有超過 75k 顆星星,並發布了 800 多個版本。

https://github.com/tauri-apps/tauri 金牛座之星 ⭐️


25. AutoGPT - 比 ChatGPT 更令人興奮。

自動gpt

AutoGPT 的核心在於其主要專案,即由大型語言模型 (LLM) 驅動的半自治代理,旨在為您執行任何任務。

AutoGPT 計畫由四個主要部分組成:

  • 代理 – 也稱為“AutoGPT”

  • 基準 – 又稱 agbenchmark

  • 熔爐

  • 前端

了解如何使用 OpenAI 金鑰設定 AutoGPT

您可以觀看Fireship 發布的有關 AutoGPT 的 YouTube 影片

https://www.youtube.com/watch?v=_rGXIXyNqpk

您也可以觀看 Sentral Media 提供的AutoGPT 教學

您可以閱讀文件並查看專案板,以了解目前正在開發的內容。

即使您對 AI 不太了解,您也可以嘗試 AutoGPT 以了解如何節省時間並建立很酷的東西。

由於如此出色的用例和自動化功能,他們在 GitHub Repo 上擁有大約 159k+ 的星星。

https://github.com/Significant-Gravitas/AutoGPT 明星 AutoGPT ⭐️


還沒結束。

現在,讓我們探索一些有價值的資源,這些資源將幫助您學習新概念並製作更好的人工智慧應用程式。

我們會保持簡單。不掛!

希望這將幫助您學習更多概念!


我希望您在列表中找到有用的東西。

我介紹了一些很棒的開源專案,它們可以將您的 AI 應用程式提升到一個新的水平。

人工智慧正在改變世界,最好與人工智慧保持朋友關係,而不是忽視它。

利用它來提高生產力,並抓住機會開發一些非凡的東西。

如果您想以最佳方式改進您的專案,有些開源專案比其他專案更有用,尤其是 Taipy 和 AutoGPT。

請發表評論,讓我們知道哪個專案最讓您感到驚訝。

祝你有美好的一天!直到下一次。

在 GitHub 上關注我。

https://github.com/Anmol-Baranwal

關注 Taipy 以了解更多此類內容。

https://dev.to/taipy


原文出處:https://dev.to/taipy/all-the-tools-i-need-to-build-a-perfect-ai-app-2oeh


共有 0 則留言