初探深度學習

更新於 2024/12/05發佈於 2024/12/05閱讀時間約 5 分鐘

深度學習是什麼?

簡單來說，深度學習是大型且多層的人工神經網路。我們可以想像神經網路（"Neural Nnetwork, NN"）是一種有向無環圖，此圖可拆分成三個部分來看: 1. 輸入層接收信號向量；2. 一個或多個隱藏層處理前一層的輸出; 3. 輸出層統合之前所有隱藏層的處理結果。神經網路的初始概念可以追溯到半個多世紀前，但是因為以前的電腦性能的侷限還有數據資料處理規模的侷限，所以神經網路無法在之前發揮效果。

一個大型且深層的神經網路擁有更多層級和每層則具備更多的節點，這導致了大型且深層的神經網路需要處理指數級增長的網路參數。沒有足夠的數據，我們無法有效地讓神經網路學習參數。沒有強大的電腦，學習過程將會過於緩慢。這裡有一個有趣的圖表，展示了數據規模與模型性能之間的關係，由Andrew Ng在他的 "How Scale is Enabling Deep Learning" 演講中提出。在小型數據集上，傳統機器學習演算法（回歸、隨機森林、支持向量機等）或統計學習演算法表現出色，但一旦數據規模大幅增加，大型神經網路的表現就會超越其他方法。部分原因是相比傳統的機器學習模型，神經網路模型擁有更多的參數，並且有能力學習複雜的非線性特徵模型。因此，我們期望模型能夠自行選擇最有用的特徵，而不需要太多專家參與的人工特徵調整。

不同的深度學習模型

不同的深度學習模型使用不同的神經網路架構，以下介紹三種最常見的架構。

Convolutional Neural Network

卷積神經網路(Convolutional Neural Network)，簡稱「CNN」，是一種前饋人工神經網路，其神經元之間的連接模式受到視覺皮層系統組織的啟發。初級視覺皮層（V1）從視網膜接收的原始視覺輸入中進行邊緣檢測。次級視覺皮層（V2），也稱為紋狀皮層前區，接收來自V1的邊緣特徵，並提取簡單的視覺屬性，如方向、空間頻率和顏色。視覺區V4處理更複雜的物體屬性。所有處理過的視覺特徵最終流入最後的邏輯單元——下顳回（IT），用於物體識別。V1和V4之間的捷徑啟發了一種特殊類型的CNN，即具有非相鄰層之間連接的殘差網路（Residual Net）（[1] He等人，2016年），其中包含「殘差塊」，支持將某一層的部分輸入傳遞到兩層之後的網路。

Recurrent Neural Network

序列模型通常被設計用來將輸入序列轉換為存在於不同領域的輸出序列。循環神經網路(Recurrent Neural Network)，簡稱「RNN」，即是採用序列模型，並在手寫識別、語音識別和機器翻譯等問題上展現出巨大的進步。

循環神經網路模型天生具有處理長序列數據的能力，並能處理隨時間擴展的上下文任務。該模型在每個時間步驟處理序列中的一個元素。計算後，新更新的單元狀態會傳遞到下一個時間步驟，以促進下一個元素的計算。想像一下，當一個RNN模型逐字閱讀所有維基百科文章時，它能夠根據上下文預測接下來的詞。

Autoencoders

自動編碼器來自於無監督學習。它被設計用來學習高維數據集的低維表示，類似於主成分分析（PCA）所做的。自動編碼器模型試圖學習一個近似函數。f(x)≈xf(x)≈x 來重現輸入數據。然而，它受到中間一個節點數量非常少的瓶頸層的限制。在容量有限的情況下，模型被迫形成一個非常高效的數據編碼，這就是自動編碼器學到的低維代碼。

Reference

http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf
https://arxiv.org/pdf/1406.1078.pdf
https://pdfs.semanticscholar.org/7d76/b71b700846901ac4ac119403aa737a285e36.pdf

1會員

35內容數

心繫正體中文的科學家，立志使用正體中文撰寫文章。此沙龍預計涵蓋各項資訊科技知識分享與學習心得

留言0

查看全部

發表第一個留言支持創作者！

Kiki的沙龍的其他內容

3GPP研究與學習相關的參考資料

3GPP官方網站和工具這些是獲取3GPP（第三代合作夥伴計劃）最新資訊的主要來源。對於研究人員和業界專業人士來說，3GPP官方資訊可供理解、實作和測試3GPP標準。另一方面，對於進行移動通訊研究的學者和學生來說，這些資源是深入了解最新技術標準和發展趨勢的重要途徑。

本篇參與的主題活動

有緣人15-從孫生事件，看我們該為孩子守住的底線—「我是父親，我有兒女，我不能沉默。」

當流量至上成為標準，性騷擾被輕描淡寫、受害者被噤聲，我們是否還能給孩子一個安全的未來？作為父親，我無法接受這種價值觀繼續影響下一代。我們該做的，不是遺忘，而是改變環境——拒絕縱容、用行動發聲，讓孩子知道「尊重是底線，說不是權利」。這不只是關於孫生，而是關於我們願意為未來的孩子守住什麼樣的世界。

#支持 #方格新手 #文章

西卡RE。LIFE人生筆記

2025/02/14

閱讀｜《小狗錢錢》：從記帳到成功日記，打造我的財務自由之路

學習《小狗錢錢》的理財方法，並透過實際操作，達成財務目標與自我提升。從記帳、設定目標、寫夢想清單、成功日記，到發展副業，分享如何將書中方法應用於生活中，並體會到理財不僅僅是管理金錢，更是規劃生活，實現夢想的重要過程。

#成功 #夢想 #日記

歐巴桑Gap year

2025/02/12

2017 vs 2024 日本東北雪景大不同！藏王樹冰、銀山溫泉、山寺的冬日奇景，好美！

比較2017年與2024年日本東北旅遊照片，對比藏王樹冰、銀山溫泉、山寺等景點在不同時間的景觀差異，即使地點相同，不同時間的體驗與感受截然不同，珍惜每個當下的珍貴回憶。2024年因暖冬導致雪景不如預期，反觀2017年的雪景壯觀美麗。新聞報導2025年日本東北暴雪，衷心祈願一切平安。

#東北 #日本 #日本旅行

簡單生活文案

2025/02/12

整理｜成為極簡主義者後，我的十個清潔小習慣

經過年末年初的大掃除，大家是否也好好整頓了自己的居家環境呢？身為家有幼童的媽媽，我也是歷經多次的練習，才調整到適合自己的清潔節奏，在此與大家分享我的清潔小撇步，每個習慣幾乎不超過5分鐘，就能換得一室乾淨，一起來看吧！

#整理 #斷捨離 #極簡主義

Jemi

2025/02/09

屏東｜德文山健行-沒想到竟成為拖鞋勇士的一天？

記錄一場前往屏東縣三地門鄉德文山（觀望山）的登山之旅，分享路線規劃、登山心得、沿途風景與美食體驗，並提醒登山客注意入山證申請及避免錯過三角點。

#蛇年大吉 #登高 #登山

方格裡的‹思›語室

2025/02/09

《錢，和你想的不一樣》03-《年薪百萬的人，和普通上班族的最大思維差距》

薪水的高低，從來不是努力的問題，而是思維的選擇。年薪百萬的人，不是單靠埋頭苦幹，而是透過「創造價值」決定自己的價格。他們懂得提升不可取代性、創造多重收入、主動尋找機會、投資自己，讓財富加速成長。與其等加薪，不如掌握「決定薪資的能力」。這篇文章，讓你看清真正的收入差距，從現在開始，為自己創造更高價值！

#人生的路 #日常 #作者

方格裡的‹思›語室

2025/02/17

有緣人15-從孫生事件，看我們該為孩子守住的底線—「我是父親，我有兒女，我不能沉默。」

#支持 #方格新手 #文章

西卡RE。LIFE人生筆記

2025/02/14

閱讀｜《小狗錢錢》：從記帳到成功日記，打造我的財務自由之路

#成功 #夢想 #日記

歐巴桑Gap year

2025/02/12

2017 vs 2024 日本東北雪景大不同！藏王樹冰、銀山溫泉、山寺的冬日奇景，好美！

#東北 #日本 #日本旅行

簡單生活文案

2025/02/12

整理｜成為極簡主義者後，我的十個清潔小習慣

#整理 #斷捨離 #極簡主義

Jemi

2025/02/09

屏東｜德文山健行-沒想到竟成為拖鞋勇士的一天？

#蛇年大吉 #登高 #登山

方格裡的‹思›語室

2025/02/09

《錢，和你想的不一樣》03-《年薪百萬的人，和普通上班族的最大思維差距》

你可能也想看

《表達與社交學》95 抱怨者嚇走強者，提問者吸引強者，所以貴人運天差地遠

提問的內容越是清晰，強者、聰明人越能在短時間內做判斷、給出精準的建議，他們會對你產生「好印象」，認定你是「積極」的人，有機會、好人脈會不自覺地想引薦給你

#後沙發 #貴人 #人脈

Learn AI 不 BI

2024/08/04

AI說書 - 從0開始 - 113 | Google Trax 安裝

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Google Brain 開發了 Tensor2Tensor（T2T），讓深度學習開發變得更加容易，T2T 是 TensorFlow 的擴展，包含深度學習模型庫，其中包

#AI #ai #promptengineering

Karen的沙龍

2024/07/28

【邁向圖神經網絡GNN】Part5: 建構 GNN model 實作 Cora 資料集結點分類任務

本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡（GNN），並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化，包括引入批量標準化和獨立的消息傳遞層，調整Dropout和聚合函數，顯著提高了模型的分類準確率。實驗結果表明，經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。

#GNN #Graph #dropout