RNN
含有「RNN」共 21 篇內容
全部內容
發佈日期由新至舊
Hank吳的沙龍
2025/07/21
深入 Transformer 學術核心:從數學原理到跨領域應用
我將從更具學術性的角度,深入探討 Transformer 模型的數學原理,並展示其在不同領域的應用範例。 以較淺顯易懂的方式介紹之後,我們將揭開 Transformer 模型內部最核心的運作機制。本文主要基於原論文《Attention Is All You Need》(Vaswani et al.
#
Transformer
#
RNN
#
NLP
喜歡
留言
Hank吳的沙龍
2025/07/21
深入淺出 LSTM:如何打造一個擁有「超級記憶力」的大腦
我們來深入淺出地拆解一下比 RNN 更強大的 LSTM 模型。 我們認識了 RNN,它像一個有短期記憶的學徒,能夠記住緊鄰的上下文。但如果句子很長,資訊很複雜,RNN 就會像金魚腦一樣,忘記開頭的關鍵資訊。這就是所謂的「長期依賴問題」。
#
RNN
#
LSTM
#
機器學習
喜歡
留言
Hank吳的沙龍
2025/07/20
深入淺出 RNN:讓機器擁有「記憶」的魔法
在之前的文章中,我們了解到像「詞袋模型」這樣的早期方法,雖然能統計詞彙,但卻像個金魚腦,完全記不住句子的順序。而 RNN(Recurrent Neural Network,循環神經網絡)的誕生,就是為了解決這個「失憶」問題。
#
RNN
#
NLP
#
文字
1
留言
Hank吳的沙龍
2025/07/20
從「文字接龍」到「情境大師」:深入淺出 NLP 模型的理論與原理
在上一篇 跟 AI 聊天的秘密:一篇文搞懂什麼是 NLP 模型 中,我們將 NLP 模型比喻為一個勤奮好學的「語言大腦」。今天,我們將更深入地走進這個大腦的內部,用最直觀的方式,理解它從「死記硬背」到「融會貫通」的進化之路。 這趟旅程將分為三個階段,對應著 NLP 模型發展的三個重要里程碑:
#
NLP
#
RNN
#
文字
喜歡
留言
虛度光陰
2025/07/04
人工智慧、機器學習和深度學習是什麼?
AI路人的小筆記,比較人工智慧(AI)、機器學習(ML)、深度學習(DL)的差異。
#
AI
#
人工智慧
#
機器學習
1
留言
Learn AI 不 BI
2024/06/15
AI說書 - 從0開始 - 18
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在AI說書 - 從0開始 - 17中,介紹了大型語言模型 (LLM)世界裡面常用到的Token,現在我們來談談OpenAI的GPT模型如何利用Inference
#
AI
#
ai
#
PromptEngineering
2
留言
Learn AI 不 BI
2024/06/15
AI說書 - 從0開始 - 17
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在AI說書 - 從0開始 - 16走過了部分AI發展軌跡,接著繼續: 在1980年代Yann LeCun設計了Convolutional Neural N
#
AI
#
ai
#
PromptEngineering
3
留言
Learn AI 不 BI
2024/06/15
AI說書 - 從0開始 - 16
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在AI說書 - 從0開始 - 15總結了Transformer比RNN還要好的結論,接著來鋪陳AI的歷史軌跡,以達到目前Transformer的巔峰。 在19
#
AI
#
ai
#
PromptEngineering
5
留言
Learn AI 不 BI
2024/06/14
AI說書 - 從0開始 - 15
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧我們在AI說書 - 從0開始 - 6中說當Context長度是n,且每個字用d維度的向量表示時有以下結論: Attention Layer的複雜度是O(n^2 *
#
AI
#
ai
#
PromptEngineering
6
留言
Learn AI 不 BI
2024/06/12
AI說書 - 從0開始 - 14
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 已經在AI說書 - 從0開始 - 12以及AI說書 - 從0開始 - 13中見識到TPU的威力了,現在我們把參數放大到真實大型語言模型的規模,看看運算時間的等級。
#
AI
#
ai
#
PromptEngineering
3
留言