Rene Wang的沙龍
首頁
翻滾吧!駭客女孩!
方案
關於
翻滾吧!駭客女孩!
29
公開內容
5
私密內容
<p>專為年輕的女孩設計的科學/資訊科技寫作計畫,希望讓每位女孩在體脂肪、青春痘與暗戀對象之外,還能找到新的生活樂趣。</p>
全部
給女孩們的程式教育
給門外漢們的深度學習
全部內容
免費與付費
最新發佈優先
Rene Wang
2021/03/19
發佈於
翻滾吧!駭客女孩!
[探索] 語言模型基礎:Subword algorithms
一個好的自然語言模型,若出現了語言模型的 vocabulary set 未曾收錄的單字,語言模型就會產生 Out-of-Vocabulary (OOV)。 本文介紹 subword algorithms 介於 word-level 和 character-level 解決 OOV 的方法。
#
DeepLearning
#
語言模型
#
深度學習
7
留言
Rene Wang
2021/02/26
發佈於
翻滾吧!駭客女孩!
網路裁減(Network Pruning)和解構樂透彩卷假說
本篇文章前半段先對網路裁減做簡單介紹,後半段針對彩卷假說作文獻式的探討。網路裁減是一種重新發現等價小網路的方法,主要目的在為 over-parameterized 的方式訓練而成的類神經網路提供一個精簡版的網路,有助於在資源受限的平台上運行。彩卷假說則是探討權重初始值和網路裁減之間的關係。
#
deeplearning
#
深度學習
#
網路裁減
5
留言
付費限定
Rene Wang
2021/01/08
發佈於
翻滾吧!駭客女孩!
[探索] 使用 Mixture of Experts 建立多任務學習框架
多任務學習指的是使用多個相關的任務目標(Multiple objectives)來學習共享的表示方法。在這篇文章中,我們會介紹 google 的 youtube recommender 系統就是利用 Multi-gate Mixture of Experts 來達成多目標多任務學習的方式。
#
DeepLearning
#
MultitaaskLearning
#
MultigateMixtureofExperts
3
留言
Rene Wang
2020/12/16
發佈於
翻滾吧!駭客女孩!
[探索] 門外漢的梯度下降變奏曲(下)
連同上兩篇文章,我們介紹了機械學習裡的基石,並踩著這些基石了解了改變資料餵送方式,以及動態改變學習率或在更新項中加入動量的方法。我們可以看到這些梯度下降的變化,主要是解決兩個問題:梯度震盪和非最佳的局部最小值造成學習停滯不前的問題。在這篇文章中,我們著重動量和 Adam 的方法來達成克服以上的問題。
#
深度學習
#
最陡梯度下降法
#
動量
3
留言
Rene Wang
2019/05/04
發佈於
翻滾吧!駭客女孩!
[探索] 門外漢的類神經網路導覽
這篇文章從類神經網路的起源,也就是單神經元的感知器。簡單的感知器迭代演算法使單神經元可以學習,但卻無法學習超過非線性,如 XOR 的資料分布。另外,本文還介紹了 Logistic regression,藉由透過非線性轉換來使線性輸出近似於機率分佈。最後則以一場大師賭局結束(SVM vs NN)。
#
類神經網路
#
SVM
#
YannLeCun
4
留言
付費限定
Rene Wang
2019/02/12
發佈於
翻滾吧!駭客女孩!
[觀點] 人工智慧的回顧與展望 2019
在 2018 年,筆者介紹了普華永道(PwC)關於人工智慧的十項預測。我們將要藉由這篇文章,先來回顧在過去的一年中,電腦視覺和自然語言領域有什麼新的發展。在本文的最後,則提及 PwC 在今年提出的六項建議,主要使已投資 AI 的公司能成功商轉,以及關於自動化資料處理和機械學習的現況。
#
人工智慧
#
自動化機械學習
#
電腦視覺
4
留言
Rene Wang
2019/01/08
發佈於
翻滾吧!駭客女孩!
[探索] 門外漢的類神經物體偵測導覽
本文提到如何以類神經網路為主的深度學習方法,來進行物體偵測。文中包括基礎的物體偵測簡介:如影像問題分類,影像處理和傳統非類神經網路為主的物體偵測方法。這些傳統方法,仍可以在類神經網路的方法中找到其應用。最後簡略敘述當前使用深度卷積網路作為物體偵測的主要研究方向,並對學術界常用的訓練資料集做分析介紹。
#
深度學習
#
物體偵測
#
卷積網路
6
留言
Rene Wang
2018/11/30
發佈於
翻滾吧!駭客女孩!
[探索] 門外漢的類神經機械翻譯導覽
在此篇文章終將會簡述機械學習的發展,簡介深度學習以 Sequence to Sequence 為架構,並在多場機械翻譯的學術年會,獲得成績斐然的結果。在本文中,會粗略介紹 Sequence to Sequence 架構並以 google 在 2017 對Seq2Seq 所進行的大規模參數。
#
深度學習
#
機械翻譯
#
sequencetosequence
4
留言
Rene Wang
2018/09/16
發佈於
翻滾吧!駭客女孩!
[探索] 現行深度學習架構概況
目前深度學習是人工智慧領域中最熱門的研究領域,許多美國科技巨頭紛紛推出他們的深度學習架構,以期能夠在人工智慧的商業應用上,能夠給使用者最無縫的服務。在本篇文章中,會以開發者和 DevOps 的角度,來談論該如何選擇最適合公司以及個人需求的深度學習架構。
#
Tensorflow
#
深度學習
#
PyTorch
9
留言
Rene Wang
2018/06/30
發佈於
翻滾吧!駭客女孩!
[探索] 門外漢的強化學習指南:A2CS 學習模型中的探索和竭盡難題
本文接續上篇直覺式強化學習教學,著重於解釋強化學習中常見的探索和竭盡難題,以及如何利用不同的方法來進行策略函式的學習,並與策略梯度做比較。同時,介紹 A2CS 所使用的損失函式,以及應用這個損失函示於深度學習時會遇到的訓練難題。最後,總結強化學習和深度學習的未來方向,以及本系列文章所企圖達到的目標。
#
人工智慧
#
強化學習
#
直覺式教學
2
留言