大語言模型

含有「大語言模型」共 60 篇內容
全部內容
發佈日期由新至舊
付費限定
摘要 自2022年11月ChatGPT發布以來,AI領域的競爭日益激烈,OpenAI作為行業領導者,正積極擴展其市場份額,並透過創新和戰略合作來應對日益商品化的模型市場。儘管OpenAI的收入迅速增長,但其高昂的運營成本和未來盈利的不確定性,以及公司獨特的組織結構所帶來的風險,都將考驗投資者的預期
Thumbnail
本文探討AI與人類集體潛意識的關聯性,指出AI生成的內容往往反映人類潛意識中的原型與模式,並提出在AI時代,人類需積極維護自身的主體性和創造力,避免淪為AI的附庸。
Thumbnail
音檔並非直接被大語言模型處理,而是先被轉換成文字,再被轉換成模型可理解的Token。本文探討音檔大小與Token數的關係,說明音檔容量與Token數並非直接相關,影響Token數的是轉換後的文字數量。
Thumbnail
冒冒-avatar-img
2025/05/03
果然是工程師的背景?XD
光淺JY-avatar-img
發文者
2025/05/12
冒冒 我不是工程師出身的,感謝我們家工程師很努力的幫助我成長🤣🤣🤣
本文以淺顯易懂的問答方式,解釋大型語言模型(LLM)的原理、訓練過程及相關概念,例如預訓練、監督式學習、增強式學習、對齊等。內容主要參考臺大李宏毅教授的 YouTube 課程,並加入個人理解與說明。
Thumbnail
今年的AI EXPO Taiwan在3月26日至28日於台北圓山花博爭豔館舉辦,因為排課的關係,我在最後一天的時候前往參觀。雖然這場展覽主要是一個B2B的展覽,不過,由於有以前當工程師的經驗,有些議題我也還是蠻感興趣,而如果能收集各種情報,或者能有一些可以從學界出發掌握的機會,我想也是很不錯的。
Thumbnail
週末把黃仁勳在今年GTC 2025大會上的演講看完了,在GTC2025的那幾天,新聞常常在報演講的內容摘要等等訊息。新聞的角度大多是以投資人角度、經濟/政治布局等方面來看整體的走向,商場的事情我不太懂,但我蠻喜歡幾個在演講中提到的技術點。 GTC March 2025 Keynote with N
Thumbnail
預計網路將在2025年擁有60億的使用者,每天與數據互動,預計總數據產生量將達到90ZB(Zettabytes),LLM 中神經網路推理方式也是類似於人的思考,一字一句的構思下一個段落來組成話語,不會有人一下接上,自己無法理解或從未看過的字眼,例如:
Thumbnail
最近正在進行期中考題的出題,並且在設計大語言模型這門選修課和資料結構這門必修課的作業的時候,我一直在想一個核心的問題:同學們需要什麼樣的能力,讓他們在畢業之後可以用來當作面對如今變化多端的業界的武器?程式設計師會被AI時代淘汰嗎? 可以用ChatGPT寫作業嗎? 由於ChatGPT等強大的基於大
Thumbnail
Deepseek 的出現重挫 Nvidia 股價,引發市場震撼。本文深入淺出地介紹 Deepseek 的三大策略:學習策略 、回饋機制和資源配置,說明其如何突破傳統「高效能=高資源」的限制,為 AI 產業帶來新的可能性。
Thumbnail