大模型

含有「大模型」共 5 篇內容
全部內容
發佈日期由新至舊
使用 OpenClaw 兩週後卸載的真實心得,記錄在 Mac 虛擬機部署 35B 大模型的踩坑過程與三個決定放棄的根本原因。
為什麼中國的元寶AI會出現「罵人+自動道歉」的怪異行為?本文拆解三個底層原因:語料人格外溢(prompt spillover)、安全層缺失(missing safety layer)與RLHF對齊破洞。並分析中國AI的工程論壇文化如何影響模型口氣。
Thumbnail
隨著人工智慧技術持續快速演進,Google於3月25日發布的Gemini 2.5 Pro再度成為業界焦點。作為迄今為止最強大的「思考型模型」,Gemini 2.5不僅在推理能力、多模態理解與編碼性能方面展現出前所未有的表現,更在多項基準測試中領先競爭對手,為大型語言模型(LLM)樹立了新的技術標竿
Thumbnail
本文以阿峰老師的角度,深入探討中國 AI 新創公司 DeepSeek 的崛起。文章剖析其低成本高效能的技術特色、產品應用,以及對全球 AI 格局帶來的影響。DeepSeek 的成功不僅挑戰了傳統 AI 開發觀念,也為台灣帶來 AI 產業發展的機會與挑戰。
Thumbnail