LLM
含有「LLM」共 127 篇內容
全部內容
發佈日期由新至舊
移幣的沙龍
2025/05/04
語言模型大評比 (不專業選型)
本文整理了許多開源語言模型,包含 DeepSeek、Cohere、Qwen、Mistral、Llama、Falcon、Gemma、Phi 以及 SmolLM 2等,並比較其優缺點、授權方式和適用情境 文章以淺顯易懂的白話文介紹各模型,涵蓋模型大小、參數量、支援語言、擅長領域、推理速度、授權限制等
#
LLM
#
DeepSeek
#
Google
2
留言
光淺JY的沙龍
2025/05/02
你以為AI會「聽」?別再誤會了!AI聽你說話其實是這樣運作的
音檔並非直接被大語言模型處理,而是先被轉換成文字,再被轉換成模型可理解的Token。本文探討音檔大小與Token數的關係,說明音檔容量與Token數並非直接相關,影響Token數的是轉換後的文字數量。
#
生成式AI
#
AI
#
AI工具
喜歡
2
冒冒
4 天前
喜歡
果然是工程師的背景?XD
喜歡
Compostela
2025/04/29
氛圍開發(Vibe Coding):創意軟體開發,不用學寫程式語法?
氛圍開發(Vibe Coding)讓寫程式不再像解謎,而像許願! 未來的軟體建構,不再是解一道道的技術難題,更像是對宇宙許下一個願望,然後軟體就誕生了。不是在寫程式,而是在指揮一場 AI 的創造力交響曲。氛圍開發(Vibe coding)將人類抽象想法轉化為清晰指令,與 AI 協作的心法與技法。
#
AI
#
生成
#
程式
1
留言
付費限定
Kiki的沙龍
2025/04/27
自己在家組Ollama大語言模型伺服器
Meta 推出了開源大型語言模型 Llama。這一代特別引人注目,因為 80 億參數的模型小到可以在家用電腦上運行,效能卻不輸比它大十倍的模型。在許多應用場景下,它給出的回應品質已經能媲美 GPT-4。在這篇文章裡,我會說明自架 Llama 3 的優缺點,並提供設定方式與資源,讓讀者也能輕鬆動手。
#
OpenAI
#
開發
#
模型
喜歡
留言
吱吱喳喳
2025/04/26
【Goolge 課程筆記】Introduction to Large Language:快速掌握 LLM 基礎概念與應用
文章提供關於大型語言模型 (LLM) 的課程筆記,涵蓋 LLM 的定義、特性、優勢、技術架構、開發方式與傳統機器學習的差異、三種類型,以及提示設計 (Prompt Design) 與提示工程 (Prompt Engineering) 的重要性。課程旨在幫助行銷人等專業人士瞭解 LLM 的基礎知識。
#
大型語言模型
#
LLM
#
Google數位人才探索計畫
12
1
Peter Lu
2025/04/27
3
謝謝分享~ 簡單易懂的資訊!
3
付費限定
分析師的市場觀點
2025/04/16
4 月美林全球經理人調查: 25 年來第 5 悲觀(重要)
4 月美林全球經理人調查:25 年來第 5 悲觀 MS AI 電力產業報告:AI capex 在不確定的總經環境下評估 - GPU 需求仍舊非常強勁 4 月美林全球經理人調查 過去 25 年以來第 5 悲觀的經理人調查,對經濟衰退預期為過去 20 年來第 4 高,創紀錄的經理人想砍美股
#
投資
#
外資報告
#
美林
喜歡
留言
EMO先生的沙龍
2025/04/13
原來哆啦A夢都是真的|Spoken LLMs帶來的革命
大型語言模型的發展,讓人們思考陪伴型機器人是否能成真,文章探討兩種實現方式:主流的語音轉文字LLM方法和新興的Spoken LLMs方法。作者認為Spoken LLMs的發展,能讓AI更自然地與人互動,實現如哆啦A夢般的陪伴型機器人,並進一步提升AI的陪伴功能。
#
SpokenLLMs
#
聯發科
#
哆啦A夢
4
留言
維那思的異想世界
2025/04/11
輝達震撼彈:Llama-3.1-Nemotron-Ultra-253B-v1 強勢登場!
輝達 (NVIDIA)公開發布了全新的開源大型語言模型:這款模型一亮相就引起了廣泛關注,原因無他,它竟然能以不到競爭對手(DeepSeek R1)一半的參數,展現出逼近甚至超越的性能。
#
模型
#
NVIDIA
#
LLM
1
1
維那思
發文者
2025/04/12
喜歡
謝謝大家的支持,本篇文章入選即時精選。
喜歡
分析師的市場觀點
2025/04/07
Meta發布Llama 4,分數超越Deepseek Claude 3.7等競爭對手
摘要 Meta 推出了 Llama 4 系列模型,包括 Llama 4 Scout 和 Llama 4 Maverick,這兩款開源多模態模型採用混合專家(MoE)架構,並在效能和成本效益上超越前代及競爭對手。Llama 4 Scout 擁有 170 億活躍參數和 10M 上下文窗口,適合單一 G
#
投資
#
台股
#
美股
2
留言
英特來糗
2025/04/07
淺談大型語言模型(LLM)原理:從原理到訓練解析
本文以淺顯易懂的問答方式,解釋大型語言模型(LLM)的原理、訓練過程及相關概念,例如預訓練、監督式學習、增強式學習、對齊等。內容主要參考臺大李宏毅教授的 YouTube 課程,並加入個人理解與說明。
#
科技
#
AI
#
人工智慧
3
留言