大語言模型
含有「大語言模型」共 57 篇內容
全部內容
發佈日期由新至舊
英特來糗
2025/04/07
淺談大型語言模型(LLM)原理:從原理到訓練解析
本文以淺顯易懂的問答方式,解釋大型語言模型(LLM)的原理、訓練過程及相關概念,例如預訓練、監督式學習、增強式學習、對齊等。內容主要參考臺大李宏毅教授的 YouTube 課程,並加入個人理解與說明。
#
科技
#
AI
#
人工智慧
3
留言
Life Notes | Guan-Yun Wang
2025/04/05
AI EXPO Taiwan 2025 參觀心得
今年的AI EXPO Taiwan在3月26日至28日於台北圓山花博爭豔館舉辦,因為排課的關係,我在最後一天的時候前往參觀。雖然這場展覽主要是一個B2B的展覽,不過,由於有以前當工程師的經驗,有些議題我也還是蠻感興趣,而如果能收集各種情報,或者能有一些可以從學界出發掌握的機會,我想也是很不錯的。
#
資訊管理
#
大語言模型
#
人工智慧
4
留言
Life Notes | Guan-Yun Wang
2025/03/30
GTC2025 黃仁勳Keynote 演講筆記
週末把黃仁勳在今年GTC 2025大會上的演講看完了,在GTC2025的那幾天,新聞常常在報演講的內容摘要等等訊息。新聞的角度大多是以投資人角度、經濟/政治布局等方面來看整體的走向,商場的事情我不太懂,但我蠻喜歡幾個在演講中提到的技術點。 GTC March 2025 Keynote with N
#
程式
#
黃仁勳
#
GTC
5
留言
36號系統 | 軟體科技 | 科幻哲思
2025/03/29
AI LLM成為第二數位大腦,多領域認知與網路知識的本質-第一版
預計網路將在2025年擁有60億的使用者,每天與數據互動,預計總數據產生量將達到90ZB(Zettabytes),LLM 中神經網路推理方式也是類似於人的思考,一字一句的構思下一個段落來組成話語,不會有人一下接上,自己無法理解或從未看過的字眼,例如:
#
AI
#
神經網路
#
大數據
3
留言
提摩西的沙龍
2025/03/20
MCP
...顯示更多
#
MCP
#
AI
#
ChatGPT
4
留言
Life Notes | Guan-Yun Wang
2025/03/09
程式設計師的終結?可不可以用ChatGPT寫作業?
最近正在進行期中考題的出題,並且在設計大語言模型這門選修課和資料結構這門必修課的作業的時候,我一直在想一個核心的問題:同學們需要什麼樣的能力,讓他們在畢業之後可以用來當作面對如今變化多端的業界的武器?程式設計師會被AI時代淘汰嗎? 可以用ChatGPT寫作業嗎? 由於ChatGPT等強大的基於大
#
大語言模型
#
ChatGPT
#
資料結構
4
留言
陪你 成長職涯
2025/02/24
【超白話】讓Nvidia一天蒸發6000億美元的Deepseek:到底為何成本這麼低?
Deepseek 的出現重挫 Nvidia 股價,引發市場震撼。本文深入淺出地介紹 Deepseek 的三大策略:學習策略 、回饋機制和資源配置,說明其如何突破傳統「高效能=高資源」的限制,為 AI 產業帶來新的可能性。
#
DeepSeek
#
Deepseek
#
ai
1
留言
付費限定
分析師的市場觀點
2025/02/03
外資CLSA里昂看DeepSeek對台股影響
DeepTrouble 還是 DeepBottom? 我們對 DeepSeek R1 的看法以及可能發生的關鍵情境雖然「AI 是一個泡沫」仍然是普遍的觀點,但敘事在幾週內從「LLM 的擴展法則已死」轉變為「LLM 過於強大」。DeepSeek 的 V3 和 R1 發佈證明了其創新性,但我們並不
#
投資
#
台股
#
外資報告
喜歡
留言
傑瑞聊AI的沙龍
2025/01/21
1/21【看一眼 AI】美國總統川普廢除前總統拜登的 AI 行政命令
⭐️ 美國總統川普上任第一天就廢除前總統拜登的 AI 行政命令 ⭐️ OpenAI 可能即將推出可以自動執行用戶電腦上的操作的 AI 工具 ⭐️ 英國政府將推出協助簡化公務員工作的 AI 助手
匿名投票
你贊成川普取消政府對於 AI 的監管?
3 個選項 · 前往投票
#
AI
#
OpenAI
#
拜登
2
留言
Kiki的沙龍
2024/12/15
檢索增強生成 RAG 簡介
檢索增強生成(Retrieval-Augmented Generation, RAG)是一種方法,可為您公司的私有資料提供客製化的 ChatGPT,使您更容易找到並使用所需的知識。它可以幫助您快速有效地與大量資訊互動。
#
人工智慧
#
機器學習
#
AI人工智慧
喜歡
留言