CodeLove 愛寫扣論壇
  • 論壇首頁
  • 學習資源
    JS 前端入門課程(精選)
  • 職涯發展
    🛠 求職準備指南|轉職前需要補充的技能 & 履歷撰寫技巧 🎯 轉職成功故事|Pchun:從硬體工程師到前端開發者的轉職之路 🚀 轉職成功故事|Birdie:從平面設計到前端,如何突破轉職困境? 💼 學員作品集|學員的學習成果與轉職作品展示
  • 社群交流
    愛寫扣論壇 - LINE 群組 愛寫扣論壇 - Discord 群組 愛寫扣論壇 - Telegram 群組
    台灣 Shopify 開發者群組 - LINE 群組
  • 開發專區
    文章 API
  • 刊登廣告
  • 發佈貼文
  • 登入
  • 註冊
🔴 訂閱 YT 頻道!站長每週分享心得! ➡️ YT 頻道 ➡️ LINE 社群 ➡️ DC 社群

transformer 學習筆記

transformer 學習筆記

站長阿川  ·  06月14日
想說學一下 LLM 基礎知識 tokenizer

https://poloclub.github.io/transformer-explainer/ 看了一下早期的 gpt tokenier https://github.com/kaisugi/gpt4_vocab_list/tree/main 有關中文的部分也少少的 鳥鳥的 但...

0個讚   0留言 18瀏覽
站長阿川  ·  06月14日
LLM 裡的 QKV:原來就是三張超大的參數表

# My thoughts by chatgpt 每個 token 都會先被轉成一個向量。這個向量可能有 768 維、4096 維,甚至更大。也就是說,一個 token 本質上就是一串很多很多數字。 進入 self-attention 的時候,這個 token vector 會再被轉成三...

0個讚   0留言 8瀏覽
站長阿川  ·  06月14日
Attention:原來就是矩陣相乘、轉比例、混合資訊

# My thoughts by chatgpt 每個 token vector 會被轉成 Q、K、V 三種向量。 Q 可以理解成「我想找什麼」。 K 是「我有什麼特徵可以被匹配」。 V 是「我真正提供的內容」。 那 attention 的下一步,就是讓每個 token 的 Q...

0個讚   0留言 6瀏覽
站長阿川  ·  06月14日
Transformer 裡的 Head 和 Layer

今天釐清了一個很容易混淆的地方:GPT-2 small 裡的 12,可能同時指 12 layers,也可能指 12 heads,但這兩個意思完全不同。 Layer 是模型的深度。GPT-2 small 有 12 層 Transformer block,意思是 token vector 會像走流...

0個讚   0留言 6瀏覽
站長阿川  ·  06月14日
Attention 負責交換,MLP 負責消化

MLP = Multi-Layer Perceptron 多層感知器 # My thoughts by chatgpt 原本我以為 Transformer 裡面,每個 token vector 經過 QKV attention 之後,就會直接變成下一層的 input。現在才發現,事情不是...

0個讚   0留言 7瀏覽
熱門搜尋: java Ai 進階 clawdbot javascript llm GitHub nano banana GIT javasc codex __ cursor vibe coding Linux javas Next [] electron C/C AI VS imgur Imgur freelancer Github copilot Php ci chatgpt JavaSCript PYTHON 後端 JS 訓練 Visual Html wEB Laravel https Linode 邁向資深之路:非同步 JS 訓練(一) Claude Code local Hook Claude code Openai Facebook Apache CRUD JavaScript monorepo jwt Java anti discord Typescript javascript系列 jquery jet la amazon the Docker hook jav 入門 乾淨 資料庫 AM Discord Flutter chat Node 聊天 go Type Python Javascript ai 改善 side clean CLI 新人 Javas -- 自學網頁の嬰兒教材:JavaScript(三)作業分享 TypeScript web Ts json next.js Git JavaScript 系列 JAVA Re VUE re am Google Gemini CLI SQL Github

Taiwan ・ Japan ・ Korea
CodeLove 愛寫扣論壇 © 2026
🛡️ 隱私及網站安全:本站註冊過程「不須提供任何個資」,只要 E-Mail 與帳密即可註冊,請安心註冊!線上付款過程使用「綠界科技 ECPay 」第三方專業金流廠商,全程在「綠界科技 ECPay 」網站進行付款程序,本站「不會紀錄任何信用卡資訊」,請放心付款、解鎖課程!您隨時可以透過 FB 粉專或者 Email 聯絡站長,請求刪除網站上的個人資料。

‹ › ×