大語言模型

含有「大語言模型」共 57 篇內容
全部內容
發佈日期由新至舊
本文以淺顯易懂的問答方式,解釋大型語言模型(LLM)的原理、訓練過程及相關概念,例如預訓練、監督式學習、增強式學習、對齊等。內容主要參考臺大李宏毅教授的 YouTube 課程,並加入個人理解與說明。
Thumbnail
今年的AI EXPO Taiwan在3月26日至28日於台北圓山花博爭豔館舉辦,因為排課的關係,我在最後一天的時候前往參觀。雖然這場展覽主要是一個B2B的展覽,不過,由於有以前當工程師的經驗,有些議題我也還是蠻感興趣,而如果能收集各種情報,或者能有一些可以從學界出發掌握的機會,我想也是很不錯的。
Thumbnail
週末把黃仁勳在今年GTC 2025大會上的演講看完了,在GTC2025的那幾天,新聞常常在報演講的內容摘要等等訊息。新聞的角度大多是以投資人角度、經濟/政治布局等方面來看整體的走向,商場的事情我不太懂,但我蠻喜歡幾個在演講中提到的技術點。 GTC March 2025 Keynote with N
Thumbnail
預計網路將在2025年擁有60億的使用者,每天與數據互動,預計總數據產生量將達到90ZB(Zettabytes),LLM 中神經網路推理方式也是類似於人的思考,一字一句的構思下一個段落來組成話語,不會有人一下接上,自己無法理解或從未看過的字眼,例如:
Thumbnail
最近正在進行期中考題的出題,並且在設計大語言模型這門選修課和資料結構這門必修課的作業的時候,我一直在想一個核心的問題:同學們需要什麼樣的能力,讓他們在畢業之後可以用來當作面對如今變化多端的業界的武器?程式設計師會被AI時代淘汰嗎? 可以用ChatGPT寫作業嗎? 由於ChatGPT等強大的基於大
Thumbnail
Deepseek 的出現重挫 Nvidia 股價,引發市場震撼。本文深入淺出地介紹 Deepseek 的三大策略:學習策略 、回饋機制和資源配置,說明其如何突破傳統「高效能=高資源」的限制,為 AI 產業帶來新的可能性。
Thumbnail
付費限定
DeepTrouble 還是 DeepBottom? 我們對 DeepSeek R1 的看法以及可能發生的關鍵情境雖然「AI 是一個泡沫」仍然是普遍的觀點,但敘事在幾週內從「LLM 的擴展法則已死」轉變為「LLM 過於強大」。DeepSeek 的 V3 和 R1 發佈證明了其創新性,但我們並不
Thumbnail
⭐️ 美國總統川普上任第一天就廢除前總統拜登的 AI 行政命令 ⭐️ OpenAI 可能即將推出可以自動執行用戶電腦上的操作的 AI 工具 ⭐️ 英國政府將推出協助簡化公務員工作的 AI 助手
Thumbnail
匿名投票
你贊成川普取消政府對於 AI 的監管?
3 個選項 · 前往投票
檢索增強生成(Retrieval-Augmented Generation, RAG)是一種方法,可為您公司的私有資料提供客製化的 ChatGPT,使您更容易找到並使用所需的知識。它可以幫助您快速有效地與大量資訊互動。
Thumbnail