LLM

含有「LLM」共 124 篇內容
全部內容
發佈日期由新至舊
大型語言模型的發展,讓人們思考陪伴型機器人是否能成真,文章探討兩種實現方式:主流的語音轉文字LLM方法和新興的Spoken LLMs方法。作者認為Spoken LLMs的發展,能讓AI更自然地與人互動,實現如哆啦A夢般的陪伴型機器人,並進一步提升AI的陪伴功能。
Thumbnail
輝達 (NVIDIA)公開發布了全新的開源大型語言模型:這款模型一亮相就引起了廣泛關注,原因無他,它竟然能以不到競爭對手(DeepSeek R1)一半的參數,展現出逼近甚至超越的性能。
Thumbnail
維那思-avatar-img
發文者
1 天前
謝謝大家的支持,本篇文章入選即時精選。
摘要 Meta 推出了 Llama 4 系列模型,包括 Llama 4 Scout 和 Llama 4 Maverick,這兩款開源多模態模型採用混合專家(MoE)架構,並在效能和成本效益上超越前代及競爭對手。Llama 4 Scout 擁有 170 億活躍參數和 10M 上下文窗口,適合單一 G
Thumbnail
本文以淺顯易懂的問答方式,解釋大型語言模型(LLM)的原理、訓練過程及相關概念,例如預訓練、監督式學習、增強式學習、對齊等。內容主要參考臺大李宏毅教授的 YouTube 課程,並加入個人理解與說明。
Thumbnail
這篇文章將搭配簡單的範例,介紹最近推出的 Docker Model Runner。內容比較隨意粗略,希望能成為讓讀者了解這項工具的契機!
這篇文章分享了幾個 iPhone 捷徑自動化應用程式,包括熱量追蹤、簡易記帳和自然語言轉提醒清單,這些捷徑都整合了 OpenAI API,可以有效提高效率。文章也推薦了幾個 Mac/iOS 自動化捷徑資源,例如 RoutineHub、Reddit shortcuts 社群和 AppleFans。
Thumbnail
週末把黃仁勳在今年GTC 2025大會上的演講看完了,在GTC2025的那幾天,新聞常常在報演講的內容摘要等等訊息。新聞的角度大多是以投資人角度、經濟/政治布局等方面來看整體的走向,商場的事情我不太懂,但我蠻喜歡幾個在演講中提到的技術點。 GTC March 2025 Keynote with N
Thumbnail
預計網路將在2025年擁有60億的使用者,每天與數據互動,預計總數據產生量將達到90ZB(Zettabytes),LLM 中神經網路推理方式也是類似於人的思考,一字一句的構思下一個段落來組成話語,不會有人一下接上,自己無法理解或從未看過的字眼,例如:
Thumbnail
付費限定
從「機器狗」到「人形機器人」 --- AI 讓機器人的技術突飛猛進,已經越來越像人類了 --- 不久的未來,肯定也很快會出現幫忙主人照顧狗狗的「人形機器人」?其實,這樣的想法早在 1989 年就出現了....
Thumbnail