初探深度學習

2024/12/05 更新2024/12/05 發佈閱讀 5 分鐘

深度學習是什麼?

簡單來說，深度學習是大型且多層的人工神經網路。我們可以想像神經網路（"Neural Nnetwork, NN"）是一種有向無環圖，此圖可拆分成三個部分來看: 1. 輸入層接收信號向量；2. 一個或多個隱藏層處理前一層的輸出; 3. 輸出層統合之前所有隱藏層的處理結果。神經網路的初始概念可以追溯到半個多世紀前，但是因為以前的電腦性能的侷限還有數據資料處理規模的侷限，所以神經網路無法在之前發揮效果。

一個大型且深層的神經網路擁有更多層級和每層則具備更多的節點，這導致了大型且深層的神經網路需要處理指數級增長的網路參數。沒有足夠的數據，我們無法有效地讓神經網路學習參數。沒有強大的電腦，學習過程將會過於緩慢。這裡有一個有趣的圖表，展示了數據規模與模型性能之間的關係，由Andrew Ng在他的 "How Scale is Enabling Deep Learning" 演講中提出。在小型數據集上，傳統機器學習演算法（回歸、隨機森林、支持向量機等）或統計學習演算法表現出色，但一旦數據規模大幅增加，大型神經網路的表現就會超越其他方法。部分原因是相比傳統的機器學習模型，神經網路模型擁有更多的參數，並且有能力學習複雜的非線性特徵模型。因此，我們期望模型能夠自行選擇最有用的特徵，而不需要太多專家參與的人工特徵調整。

不同的深度學習模型

不同的深度學習模型使用不同的神經網路架構，以下介紹三種最常見的架構。

Convolutional Neural Network

卷積神經網路(Convolutional Neural Network)，簡稱「CNN」，是一種前饋人工神經網路，其神經元之間的連接模式受到視覺皮層系統組織的啟發。初級視覺皮層（V1）從視網膜接收的原始視覺輸入中進行邊緣檢測。次級視覺皮層（V2），也稱為紋狀皮層前區，接收來自V1的邊緣特徵，並提取簡單的視覺屬性，如方向、空間頻率和顏色。視覺區V4處理更複雜的物體屬性。所有處理過的視覺特徵最終流入最後的邏輯單元——下顳回（IT），用於物體識別。V1和V4之間的捷徑啟發了一種特殊類型的CNN，即具有非相鄰層之間連接的殘差網路（Residual Net）（[1] He等人，2016年），其中包含「殘差塊」，支持將某一層的部分輸入傳遞到兩層之後的網路。

Recurrent Neural Network

序列模型通常被設計用來將輸入序列轉換為存在於不同領域的輸出序列。循環神經網路(Recurrent Neural Network)，簡稱「RNN」，即是採用序列模型，並在手寫識別、語音識別和機器翻譯等問題上展現出巨大的進步。

循環神經網路模型天生具有處理長序列數據的能力，並能處理隨時間擴展的上下文任務。該模型在每個時間步驟處理序列中的一個元素。計算後，新更新的單元狀態會傳遞到下一個時間步驟，以促進下一個元素的計算。想像一下，當一個RNN模型逐字閱讀所有維基百科文章時，它能夠根據上下文預測接下來的詞。

Autoencoders

自動編碼器來自於無監督學習。它被設計用來學習高維數據集的低維表示，類似於主成分分析（PCA）所做的。自動編碼器模型試圖學習一個近似函數。f(x)≈xf(x)≈x 來重現輸入數據。然而，它受到中間一個節點數量非常少的瓶頸層的限制。在容量有限的情況下，模型被迫形成一個非常高效的數據編碼，這就是自動編碼器學到的低維代碼。

Reference

http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf
https://arxiv.org/pdf/1406.1078.pdf
https://pdfs.semanticscholar.org/7d76/b71b700846901ac4ac119403aa737a285e36.pdf

留言

留言分享你的想法！

Kiki的沙龍

5會員

67內容數

心繫正體中文的科學家，立志使用正體中文撰寫文章。此沙龍預計涵蓋各項資訊科技知識分享與學習心得

Kiki的沙龍的其他內容

2025/04/27

自己在家組Ollama大語言模型伺服器

Meta 推出了開源大型語言模型 Llama。這一代特別引人注目，因為 80 億參數的模型小到可以在家用電腦上運行，效能卻不輸比它大十倍的模型。在許多應用場景下，它給出的回應品質已經能媲美 GPT-4。在這篇文章裡，我會說明自架 Llama 3 的優缺點，並提供設定方式與資源，讓讀者也能輕鬆動手。

2025/04/27

自己在家組Ollama大語言模型伺服器

2025/04/20

建立人工智慧代理人實務指引

這份實務指引旨在協助產品和工程團隊入門大型語言模型（LLM）驅動的人工智慧代理人建構，它定義了代理的核心概念，例如獨立執行任務和利用 LLM 管理工作流程決策。本文闡述了何時應考慮建立代理，特別是在傳統自動化方法受限的複雜情境，並深入探討了代理設計的基礎要素，包括模型選擇、工具整合及指令設置。

2025/04/20

建立人工智慧代理人實務指引

2025/04/06

用Docker Model Runner 輕鬆在本地執行 LLM

這篇文章將搭配簡單的範例，介紹最近推出的 Docker Model Runner。內容比較隨意粗略，希望能成為讓讀者了解這項工具的契機！

2025/04/06

用Docker Model Runner 輕鬆在本地執行 LLM

這篇文章將搭配簡單的範例，介紹最近推出的 Docker Model Runner。內容比較隨意粗略，希望能成為讓讀者了解這項工具的契機！

#方格新手的其他內容

🎄【深夜諮詢】有人問我：如果小精靈都被 AI 取代，孩子還會相信魔法嗎？

李羊《分享勇氣：街頭藝人的洗鞋創業之旅》

絕對零度的沙龍

日本獨旅經驗分享：機票、景點、省錢攻略，讓你找回旅行的初衷

你可能也想看

MimiVsJames的美股投資分享

新的一年想要賺贏過大盤，你該做的幾件關鍵投資選擇

不是每個人都適合自己操盤，懂得利用「專業」，才是績效拉開差距的開始

#美股投資#美股#投資理財

2025/12/22

MimiVsJames的美股投資分享

新的一年想要賺贏過大盤，你該做的幾件關鍵投資選擇

不是每個人都適合自己操盤，懂得利用「專業」，才是績效拉開差距的開始

#美股投資#美股#投資理財

2025/12/22

剝洋蔥

「還可以啦」即是平庸的時代：中間長尾的消失與新商業模式

生產力爆發帶來的過剩，會讓過去的「還可以啦」成為最低標準。市場需求對於出類拔萃、獨一無二的需求還是存在，但是對於那些價格高度敏感，或是只需要穩定、便宜、還可以啦的需求端來說，AI 正在迅速取代這部分的供給，中間長尾的服務提供者被 AI 替換。

#AI#商業模式#創作者經濟

2025/12/21

剝洋蔥

「還可以啦」即是平庸的時代：中間長尾的消失與新商業模式

#AI#商業模式#創作者經濟

2025/12/21

方格子 vocus 官方沙龍

聖誕跨年不想再孤單？vocus 編輯群實測：把交友軟體當成「真心話問答」，在 Ping! 慢慢認識人

年末總有一種莫名的魔力，讓人特別容易感到孤單。聖誕節、跨年、緊接著農曆新年……滑開社群，不是甜蜜放閃，就是一群人早早訂好跨年行程。明明日子算得上順遂，工作穩定無憂，生活也按部就班地往前走着，可總在萬籟俱寂的夜晚，獨自對着空蕩的房間時，心底會悄悄冒出一個念頭：今年，是不是可以不一樣？不再獨自抵

#交友軟體#安心#Android

2025/12/23

方格子 vocus 官方沙龍

聖誕跨年不想再孤單？vocus 編輯群實測：把交友軟體當成「真心話問答」，在 Ping! 慢慢認識人

#交友軟體#安心#Android

2025/12/23

越南放大鏡 X 下班資工系

🚀 從零開始理解神經網路深度學習 MLP

很常聽到深度學習，但到底是在學些什麼？今天來跟我一起學習一個重要的概念：多層感知機（MLP, Multi-Layer Perceptron）是最基礎的神經網路之一。它雖然簡單，卻是許多進階模型的基礎，例如 CNN（卷積神經網路）和 Transformer（變換器）（某論文），用於處理自然語言模

2025/02/18

2025/02/18

【資料分析】深度學習 DNN、CNN、RNN 概述

本文章提供深度學習(Deep Learning)、深度神經網絡(DNN)、卷積神經網絡(CNN)和遞歸神經網絡(RNN)的簡介，並包含它們的定義、應用場景、基本結構、工作原理、優缺點和Python範例。

#數據#python#分析師

2025/01/21

JayRay 的沙龍

【資料分析】深度學習 DNN、CNN、RNN 概述

#數據#python#分析師

2025/01/21

Kiki的沙龍

初探深度學習

深度學習是什麼? 簡單來說，深度學習是大型且多層的人工神經網路。我們可以想像神經網路（"Neural Nnetwork, NN"）是一種有向無環圖，此圖可拆分成三個部分來看: 1. 輸入層接收信號向量；2. 一個或多個隱藏層處理前一層的輸出; 3. 輸出層統合之前所有隱藏層的處理結果。神經網路的初

2024/12/05

2024/12/05

輸入層：接收數據，對應特徵值，是網絡的入口。隱藏層：學習數據的抽象特徵，引入非線性，處理複雜模式。輸出層：產生結果，將特徵轉換為預測值(regression)或分類(classification)結果。陳縕儂老師說過中間的隱藏層通常不會是線性的如果全部都是線性那任意交換隱藏層

2024/11/26

2024/11/26

[AI小學堂(二)]神經網路是什麼? 淺談深度學習的神經網路Neural Network的架構

在我的上一篇文章中，我們提到了人工智慧 & 機器學習 & 深度學習跟神經網路的關係，我們也了解到了所謂的深度學習是一種基於神經網路上的機器學習方法。那麼神經網路到底是什麼呢? 我們上一篇文章裡面提到的神經網路的層Layer究竟是什麼呢? 到底為什麼神經網路需要這麼多的神經元(Neurons)跟層數呢

#DeepLearning#AI#neuralnetwork

2023/05/30