大語言模型

含有「大語言模型」共 37 篇內容
全部內容
發佈日期由新至舊
馬斯克領導的AI新創公司xAI,估值從2024年5月的240億美元增至500億美元,並計劃籌集60億美元資金以建立全球最強超級電腦「Colossus」。其中,中東主權財富基金提供了約50億美元的關鍵支持。xAI將以此強化語言模型和自動駕駛技術,挑戰OpenAI等競爭者,並在AI領域中拓展影響力。
本文介紹了目前主要的LLM提供商,包括OpenAI、Google、Meta、Anthropic及Microsoft,並且探討了選擇LLM提供商時的考量因素。文章還預測了LLM的未來發展趨勢,如模型小型化、多模態模型及更廣泛的應用。透過比較不同提供商的特點,幫助讀者選擇適合的LLM以滿足他們的需求。
Thumbnail
「 LLM 讓自動駕駛變暖男、到貨不準時客人不回購、零售科技用遊戲獎勵養理想來客 」 選些每週看到有趣的新聞新知,有商業、有零售、有科技新知,重不重要是其次,有趣才有看的價值。
Thumbnail
Liquid AI,一家從麻省理工學院衍生的創新公司,正開發一種全新的AI模型,以「第一原理」為基礎,突破傳統GPT框架的限制。這些模型強調因果關係、可解釋性以及環境永續性,目標是提高AI的效率與透明度,特別適用於特定領域與通用系統。Liquid AI 並有望成為未來 AI 發展的新標竿。
Thumbnail
本文介紹大型語言模型(LLM)的基礎概念和當前主流模型,包括OpenAI的ChatGPT、Google的Gemini、Meta的Llama、Anthropic的Claude和AI21 Labs的Jurassic。LLM具有強大的自然語言處理能力,LLM的發展將持續影響人類的交流和資訊處理方式。
Thumbnail
本篇文章將幫助讀者深入瞭解人工智慧(AI)的基本概念及其涉及的多項重要技術,包括機器學習、深度學習、類神經網絡等關鍵詞。透過對這十個關鍵詞的系統解析,讀者能夠掌握AI的基礎,進而展開對AI領域的深入學習。文章鼓勵讀者留言提問,以便獲得更直接的解釋,助力AI學習之旅。
Thumbnail
今天看到有人在微信po說用大模型翻譯藏文文獻比較,因此想說引用記錄下來,免的之後看不到了。 我目前沒有試用過,大家可以自己試試看! 原文參考自:如何用大模型翻譯藏文文獻 以下正文 1.翻譯品質對比 claude 3.5 sonnet某些層面上比Openai的Gpt4.0要好,對內容有註釋
Thumbnail
1. 低估大語言模型對學術研究的深遠影響: - 許多碩博士生可能認為大語言模型僅僅是處理文字的工具,沒有意識到它們在學術研究中的潛力。例如,這些模型能協助快速整理文獻、生成初步的研究報告,甚至提供語言上的支持來幫助撰寫論文。如果未能充分了解大語言模型的強大功能,就可能錯過使用這些工具來提升研
步驟 1: 計劃每天花點時間學習大語言模型的技術部分。 步驟 2: 選擇合適的教材。我選擇了Manning出版的《Build a Large Language Model (From Scratch)》,這本書有配套的程式碼和詳細的講解,是我信賴的學習素材。 步驟 3: 瀏覽教材中的程式
機器其實不是像人類這樣一的單字對應一個單字去翻譯, 而是使用「編碼器 Encoder」與「解碼器 Decoder」來做語言之間的翻譯。 其中編碼器的任務,是「閱讀 Read」與「處理 Process」完整的文本, 而解碼器的任務,則是「產生 Produced」翻譯過後的文本。