
LSTM 的全名叫做:
簡單說,它是一種進化版的 RNN(循環神經網路),Long Short-Term Memory(長短期記憶)
專門用來解決 RNN 記性太差的問題!
為什麼需要 LSTM?
傳統 RNN 有一個很大的毛病:
記得不久、忘得超快!
一旦輸入的資料很長(例如一整段文章或長時間的語音),RNN 很容易「忘記前面講了什麼」,就像你聽課聽到一半放空,再也接不回原本的主題。
LSTM 的厲害在哪?
LSTM 多了一套叫做「記憶門控機制」的設計,讓它能:
- 記得該記的資訊(像你記得老師的考點)
- 忘記不重要的資訊(像你自動略過老師打哈欠)
- 適時更新記憶(像你知道什麼時候該換筆記重點)
這就讓 LSTM 成為「記憶力超好的 RNN 版本」。
用生活比喻來說:
- RNN:像一個上課沒睡飽的學生,老師剛講過就忘記了。
- LSTM:像一個會用螢光筆的人,知道哪裡該畫記,記得超牢。
LSTM 用在哪些地方?
它特別適合處理「長時間有順序」的資料:
- 語音轉文字(語音辨識)
- 文章分類(自然語言處理)
- 股票預測(時間序列)
- 語言模型(早期機器翻譯)
- 情緒分析(從文字判斷情緒)
雖然現在 Transformer 比它強,但 LSTM 還是很多模型的「重要前輩」!
一句話總結:
LSTM 是記憶力超強的 RNN 升級版,能幫 AI 分清楚什麼該記、什麼該忘。