您在閱讀英文投影片或技術文件時是否有困難?
對於工程師和研究人員來說,英語是閱讀論文和了解海外資訊的必需技能。
如果您是 PM 或技術銷售人員,您將需要了解包含技術術語的提案文件。
雖然讓 ChatGPT 或 Gemini 向您解釋事情是可以的,但我相信你們中的許多人都有過被同時顯示的大量文本淹沒的經歷。
順便說一下,我想喜歡YouTube的人、新冠疫情時代的大學生、在補習班上過影片課程的人以及喜歡電視的人都很熟悉它,但我認為最近通過影片了解訊息變得越來越普遍。
影片已成為各世代的普遍現象。
在這種情況下,我經常會想,“如果在日常工作中也能通過影片了解訊息就好了。”
我目前正在研究影片AI之類的課題,但由於大部分資訊來自海外,我必須用英文跟上。我很難跟上那些快速使用的技術術語和英語。
當然,我們正在充分利用ChatGPT等工具,但我個人不擅長閱讀文字,更喜歡看影片,所以覺得透過影片來了解研發進度也挺好的。
經過大量搜尋,我終於找到了一個令我滿意的解決方案...
在本文中,我將介紹一種方法,可以立即將您的幻燈片變成您自己的個性化影片,非常適合那些像我一樣英語不好並且想要在影片中根據自己的水平解釋技術術語的人!
具體來說,我們將使用名為 n8n 的 AI 工作流程工具來建立一個 AI 工作流程,將幻燈片立即轉換為個人化的解釋影片。
本文旨在讓您無需任何 AI 專業知識或複雜的軟體工程即可嘗試,因此我希望您能快速閱讀它。
1 | 建立工作流程
2 | 製作影片為什麼好?
3 | 具體工作流程設計方法
努力創作手冊的人
想要使用 AI 製作研討會影片的人
任何對視訊或生成式人工智慧感興趣的人
X 每天都會發布類似的影片和有關 AI 的訊息,因此如果您能透過關注和喜歡我們來支持我們,我們將不勝榮幸。
他們提供有關影片 AI 和使用 n8n 的全自動影片編輯的訊息,因此如果您關注他們,您就可以了解如何使用它和邊緣情況。
現在,讓我一一解釋一下。
首先,我將介紹從我們這次建立的幻燈片建立動畫的工作流程。
透過遵循上面顯示的工作流程,我們會自動從您的投影片建立個人化影片。
儘管它看起來擁有大量節點,令人印象深刻,但它實際做的事情卻出奇的簡單。
現在,影片製作流程已在系統中實現並按順序執行。此工作流程允許以相同的方式建立包含 10 張投影片或 100 張投影片的影片。
如果有正面的回應,我計劃免費分發工作流程本身,因此我很樂意在 X 或其他地方收到回饋。
您可能想知道,為什麼要費力將幻燈片製作成影片?
然而,投影片越專業,就越難以一下子理解其內容。
即使在商務人士中,能快速閱讀財務報表或技術方案文件的人也不多。如果你能做到,你就是這個領域的專家。
為幻燈片加入動畫的主要好處是:
可以將任意數量的幻燈片製作成影片
支援日語以外的語言
即使你沒有專業知識,你也可以理解這些內容
除了個人使用之外,如果您的團隊成員來自海外並且只有日語材料,您仍然可以製作適合成員語言和理解水平的影片。
我們相信,當您需要與團隊分享材料時,幻燈片動畫特別有用,因為它們可以輕鬆地跨越語言和知識障礙傳達訊息。
這不是革命性的嗎?
以下是幻燈片動畫的範例:
視訊培訓教材
在詳細規範和法規變化的行業和領域中,當製作影片很困難時,它很有用。
自動為 Udemy 等建立研討會。
使用 Manus 建立研討會投影片 → 自動產生研討會影片等,實現完全自動化的內容銷售。
透過將大學講座材料轉換為影片,您可以根據您的學習水平和理解定制解釋影片。
自動建立多語言翻譯影片
即使只有日文素材,也可以製作針對外國人的自動化手動影片。
將您的 LT 簡報資料製作成影片並將其發佈在 YouTube 和 TikTok 上,以便為更多人提供價值。
除了在 Slideshare 上發布之外,將您的知識製作成影片將有助於覆蓋更廣泛的受眾。
您所在領域之外的技術文件影片
即使您沒有任何先驗知識,人工智慧也會根據您的情況製作影片。
此外,此工作流程不使用影片生成 AI「擴散模型」(儘管它確實使用了文字生成 AI)。
這有以下正面:
您可以建立可立即在現場使用的影片
穩定生成。由於它不使用擴散模型來生成影片,而是依賴幻燈片等現有內容,因此即使您沒有任何先驗知識,也可以輕鬆建立所需的影片。
它比影片生成 AI 便宜得多
使用影片生成AI,製作一分鐘的影片成本超過1000日圓。而我們的影片產生流程,製作一分鐘的影片成本不到10日圓。簡單比較一下成本,它就好上100倍。
當然,由於生成的影片的目的不同,因此無法進行簡單的比較,但我認為這次有很多工作場所需要的影片。
從便利性和成本的角度來考慮,我們相信這種方法會比視訊生成AI應用在更多的地方。
在這裡我們將解釋如何設計自動化工作流程來製作投影片動畫。
這次,載入 Google 幻燈片
我們將在未來的單獨文章中介紹其他格式的幻燈片以及匯入 PDF 並將其轉換為影片的情況,或者我們將發布有關如何在 X 上建立它們的說明。
首先,準備好要轉成影片的幻燈片。這次我們將介紹一個自動將 Google 投影片轉換成影片的系統,所以請準備好您的 Google 投影片。
您可以使用像 Manus 這樣的人工智慧來準備幻燈片,也可以使用您自己的幻燈片。
從幻燈片連結取得幻燈片。
點選開始執行
根據幻燈片連結獲取有關 n8n 的幻燈片
逐頁取得該投影片的文字資訊和投影片縮圖
工作流程中產生的所有中間檔案(圖像、音訊、srt 等)都保存在 Google Drive 中。
從那時起,該過程將按順序對每個幻燈片頁面進行。
為每張投影片建立一個演講稿。如果你在設計演講稿時,能夠清楚地解釋每個場景,同時又能兼顧投影片的整體流程,那麼演講稿會更自然。
這個領域還有很大的改進空間,例如在提示中包含整個投影片的摘要或使用場景縮圖作為輸入來建立更詳細的談話腳本。
每個場景的談話腳本都以 JSON 格式儲存。
語音是根據您建立的對話腳本產生的。您可以使用任何您喜歡的語音產生系統或服務。 Elevenlabs 的日語語音聽起來非常自然且易於使用。 Google 的 TTS 也能產生非常自然的日文語音。
這次是用VOICEVOX創作的
關於字幕的要點:
許多解說影片都配有完整字幕(每句台詞都有字幕)。當然,字幕必須與音訊同步。如果字幕與影片內容完全無關,觀眾會感到困惑。
字幕的視覺自然也很重要。例如,如果標點符號(,ya.)或助詞出現在開頭,觀眾會覺得很奇怪。這類字幕的視覺優化也很重要。
在這個工作流程中,我們使用 LLM 來協助視覺優化。
- LLM(OpenAI API)で改行や表示のまとまり(ページング)の処理を実行しています。シーンごとにスクリプトを読み込ませてテロップの最適化をAIに提案させます。
- ちなみにsrtファイルを作成するときにはElevenlabsのSTTでタイムスタンプを取得して、その情報とテロップ表示情報を統合した処理を実装しています。
利用ffmpeg將上述過程建立的素材按場景進行集成,並渲染成影片。
您可以透過將字幕從 srt 轉換為 asr 文件,輕鬆地將設計和動畫應用於字幕。
您可以使用 ffmpeg 指令控制幻燈片的放置和過渡(切換場景時的動畫)。
順便說一下,在這個實作中我們加入了插入背景音樂的過程。
如上所述,透過綜合結合文字、圖像、音訊等,可以自動建立影片。
雖然工作流程很長,但是每個步驟都很簡單,所以如果你把它分解並組織起來,它就有廣泛的應用範圍和很大的可能性。
您覺得怎麼樣?
我們介紹了 n8n 工作流程,該工作流程可自動從投影片建立簡報影片。演示和說明性影片的應用範圍非常廣泛,而且非常實用,因此我們認為它們可以輕鬆應用於日常工作和學習。我們鼓勵您優化這些影片,以製作出盡可能優質的影片。
此外,如果您能自己設計這個工作流程,那麼這對於在工作中運用生成式人工智慧來說,將是一次很棒的訓練體驗,所以不妨嘗試一下。您將獲得建構事物、將其整合到系統中的能力,並了解何時使用人工智慧。
X 每天都會發布類似的影片和有關 AI 的訊息,因此如果您能透過關注和喜歡我們來支持我們,我們將不勝榮幸。
他們提供有關影片 AI 和使用 n8n 的全自動影片編輯的訊息,因此如果您關注他們,您就可以了解如何使用它和邊緣情況。
您可能也對以下內容感興趣:
原文出處:https://qiita.com/Nicola_GenAI/items/46f5bfde4afc2aa214b5