LLM

含有「LLM」共 127 篇內容
全部內容
發佈日期由新至舊
本文整理了許多開源語言模型,包含 DeepSeek、Cohere、Qwen、Mistral、Llama、Falcon、Gemma、Phi 以及 SmolLM 2等,並比較其優缺點、授權方式和適用情境 文章以淺顯易懂的白話文介紹各模型,涵蓋模型大小、參數量、支援語言、擅長領域、推理速度、授權限制等
Thumbnail
音檔並非直接被大語言模型處理,而是先被轉換成文字,再被轉換成模型可理解的Token。本文探討音檔大小與Token數的關係,說明音檔容量與Token數並非直接相關,影響Token數的是轉換後的文字數量。
Thumbnail
冒冒-avatar-img
4 天前
果然是工程師的背景?XD
氛圍開發(Vibe Coding)讓寫程式不再像解謎,而像許願! 未來的軟體建構,不再是解一道道的技術難題,更像是對宇宙許下一個願望,然後軟體就誕生了。不是在寫程式,而是在指揮一場 AI 的創造力交響曲。氛圍開發(Vibe coding)將人類抽象想法轉化為清晰指令,與 AI 協作的心法與技法。
Thumbnail
付費限定
Meta 推出了開源大型語言模型 Llama。這一代特別引人注目,因為 80 億參數的模型小到可以在家用電腦上運行,效能卻不輸比它大十倍的模型。在許多應用場景下,它給出的回應品質已經能媲美 GPT-4。在這篇文章裡,我會說明自架 Llama 3 的優缺點,並提供設定方式與資源,讓讀者也能輕鬆動手。
文章提供關於大型語言模型 (LLM) 的課程筆記,涵蓋 LLM 的定義、特性、優勢、技術架構、開發方式與傳統機器學習的差異、三種類型,以及提示設計 (Prompt Design) 與提示工程 (Prompt Engineering) 的重要性。課程旨在幫助行銷人等專業人士瞭解 LLM 的基礎知識。
Thumbnail
Peter Lu-avatar-img
2025/04/27
謝謝分享~ 簡單易懂的資訊!
付費限定
4 月美林全球經理人調查:25 年來第 5 悲觀 MS AI 電力產業報告:AI capex 在不確定的總經環境下評估 - GPU 需求仍舊非常強勁 4 月美林全球經理人調查 過去 25 年以來第 5 悲觀的經理人調查,對經濟衰退預期為過去 20 年來第 4 高,創紀錄的經理人想砍美股
Thumbnail
大型語言模型的發展,讓人們思考陪伴型機器人是否能成真,文章探討兩種實現方式:主流的語音轉文字LLM方法和新興的Spoken LLMs方法。作者認為Spoken LLMs的發展,能讓AI更自然地與人互動,實現如哆啦A夢般的陪伴型機器人,並進一步提升AI的陪伴功能。
Thumbnail
輝達 (NVIDIA)公開發布了全新的開源大型語言模型:這款模型一亮相就引起了廣泛關注,原因無他,它竟然能以不到競爭對手(DeepSeek R1)一半的參數,展現出逼近甚至超越的性能。
Thumbnail
維那思-avatar-img
發文者
2025/04/12
謝謝大家的支持,本篇文章入選即時精選。
摘要 Meta 推出了 Llama 4 系列模型,包括 Llama 4 Scout 和 Llama 4 Maverick,這兩款開源多模態模型採用混合專家(MoE)架構,並在效能和成本效益上超越前代及競爭對手。Llama 4 Scout 擁有 170 億活躍參數和 10M 上下文窗口,適合單一 G
Thumbnail
本文以淺顯易懂的問答方式,解釋大型語言模型(LLM)的原理、訓練過程及相關概念,例如預訓練、監督式學習、增強式學習、對齊等。內容主要參考臺大李宏毅教授的 YouTube 課程,並加入個人理解與說明。
Thumbnail