王啟樺的沙龍
首頁
討論區
紫式散文
次原子想法
LLM 筆記
我的卡片盒
原子寫作
三十而立
數據隱私
紫式書摘
原紫短文
Me, Myself & AI
數位筆記
大綱即寫作
語音寫作
AI寫作
紫式系列文
紫式思考
卡片盒筆記法
方案
關於
其他連結
精彩內容
全部內容
LLM 005|大語言模型是如何利用Transformer理解語言的?
現代大語言模型建構於Transformer結構。 Transformer結構是源自於2017年著名論文 Attention Is All You Need的深度神經網路結構。 原始的Trasformer是為了機器翻譯發展,當初的任務是將英文翻譯成德文與法文。 Transformer
王啟樺
發佈在
LLM 筆記
2024-04-27
5
#
大語言模型
#
Transformer
#
ChatGPT
036|是什麼使得一份自傳履歷在招聘中脫穎而出?
最近有幸參與中研院統計所的暑期實習生招聘,我也開啟了招聘人的視角。 作為招聘人,第一個目標是用盡可能短的時間,看完這101份申請人的資料。 而由於每個申請人基本都是學生, 基本上都會提交三項文件:自傳履歷,學校成績單,推薦信。 你覺得哪一項文件最可能讓我花10秒以上呢?
王啟樺
2024-04-27
8
#
履歷
#
中研院
LLM 004|創建大語言模型需要哪兩個關鍵階段?
從頭開始寫大語言模型的程式碼, 是最好理解大語言模型的機制與限制的方風。 從頭開始寫大語言模型的程式碼,可以幫助我們得到預訓練與微調整開源大語言模型架構所需要的知識,並應用到特定領域的數據及以及任務。 客製化大語言模型一般來說比起通用大語言模型有更好的表現。 一個具體的例子是
王啟樺
發佈在
LLM 筆記
2024-04-26
4
#
大語言模型
#
ChatGPT
#
Transformer
035|UCLA統計與資料科學系博士後研究員如何選擇學術任務以最大化長期利益?
托學術界彈性工時的福, 我可以規律採用週日到週四工作的節奏。 週日到週四這五天被我定義為工作日。 每個工作日一早,我會在律構本 Legal Pad上寫下今天的行動規劃。 我規劃行動的方法,我稱為「135任務」。 其中135表達的意思是1件大事,3件中事以及5件小事。
王啟樺
2024-04-26
5
#
UCLA
LLM 003|人工智慧如何從數據中學習?
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
王啟樺
發佈在
LLM 筆記
2024-04-25
8
#
大語言模型
#
ChatGPT
#
人工智慧
034|為什么進入專業圈子對你的事業發展至關重要?
談到文化知識,以我的背景,比起非台灣人我對台灣的文化的理解就有一個優勢。 如此,其實當你屬於某種社群,某個圈子,你就能得到外人沒有,圈子內的人才有的知識。 例如我長期參與Nick Milo的Linking Your Thinking社群, 就能有許多高品質關於Obsidian用於知
王啟樺
2024-04-25
6
【UCLA統計與資料科學系博士後研究員的知識工作生產線】
紅色良品(等級0)- 資訊源索引 功能:將書籍和課程轉化為Obsidian中可索引的筆記。這種做法可以幫助你更快地從大量文本中找到需要的資訊。 藍色良品(等級1)- 資訊塊 功能:將書籍或課程中的具體內容段落轉化為Obsidian中可索引的筆記。這樣做可以讓你對特定知識點有更深
王啟樺
發佈在
數位筆記
2024-04-24
9
#
UCLA
#
Obsidian
#
知識生產
LLM 002|大語言模型中的「大」是如何幫助預測下一個字的?
大語言模型是一種特殊的神經網路,設計來理解,生成與回應人類的文本。 大語言模型是使用大量文本數據訓練的深度神經網路,其訓練使用的文本數據甚至包括了整個網路公開的文本。 大語言模型的「大」,體現於模型的參數個數以及其使用的訓練數據集。如此大的模型可以有百億甚至千億的參數。這些參數都是神經網
王啟樺
發佈在
LLM 筆記
2024-04-24
4
#
大語言模型
033|如何在在洛杉磯尋找東方和西方的完美交融?
目前我住在洛杉磯的Sawtelle區域。 Sawtelle又稱小大阪,是洛杉磯的一個蠻不錯的日本城。 我每週都會走路去小大阪裡的Nijiya 超市買散壽司與握壽司。 另外,從住處附近搭4號公車一小時,就能到好萊塢星光大道。 雖然來了洛杉磯快兩年,我也是上週因為出差才來到好萊塢
王啟樺
2024-04-24
13
#
洛杉磯
#
日本
LLM 001|大語言模型如何革新傳統的自然語言處理任務?
大語言模型,例如OpenAI提供的ChatGPT,是過去幾年發展的深度神經網路模型,開啟自然語言處理的新紀元。
王啟樺
發佈在
LLM 筆記
2024-04-23
5
#
大語言模型
#
ChatGPT
加入沙龍
加入沙龍