大型語言模型

含有「大型語言模型」共 47 篇內容
全部內容
發佈日期由新至舊
Andrej Karpathy是AI領域的知名專家,曾在特斯拉和OpenAI工作,專注於深度學習和電腦視覺。影片中示範了大型語言模型(LLM)的實用應用,從基本互動到進階功能,如搜尋工具、檔案處理、自訂GPT、模型選擇、工具使用(如搜尋和深度研究)、程式碼撰寫、音視頻處理、圖像生成等。
Thumbnail
Andrej Karpathy是AI領域的知名專家,曾在特斯拉和OpenAI工作,專注於深度學習和電腦視覺。影片中示範了大型語言模型(LLM)的實用應用,從基本互動到進階功能,如搜尋工具、檔案處理、自訂GPT、模型選擇、工具使用(如搜尋和深度研究)、程式碼撰寫、音視頻處理、圖像生成等。
Thumbnail
DeepSeek崛起,中國AI新勢力衝擊全球!本文深入探討DeepSeek技術突破、AI產業發展趨勢、企業應用與監管挑戰。阿峰老師剖析AI發展的「油門與煞車」,並分享AI時代個人與企業的應變之道,帶領讀者掌握AI新知,提升競爭力。
Thumbnail
Andrej Karpathy 深入淺出地介紹大型語言模型的訓練流程,將其比喻成學生學習過程)的三個階段,並佐以生活化的例子,讓讀者更容易理解大型語言模型的運作方式。
Thumbnail
付費限定
圍繞 DeepSeek AI 開發的爭議核心在於指控其從 OpenAI 的專有系統中進行模型蒸餾,引發了知識產權(IP)和 AI 倫理實踐的質疑。以下是詳細分析: OpenAI 的關鍵指控 OpenAI 聲稱 DeepSeek 使用「蒸餾」技術以極低成本複製了 GPT-4o 和 o1-pre
Thumbnail
這篇文章分享使用GPT4ALL軟體安裝及操作DeepSeek R1模型的過程,並說明本地端部署的優勢,例如資料隱私和安全性。文章涵蓋環境準備、軟體安裝、模型下載和掛載,以及實際操作與測試範例,並深入探討本地端部署的硬體需求和未來發展。
Thumbnail
本文將帶你快速了解如何使用DeepSeek R1 + 類似ChatGPT的介面可以與大型語言模型互動 前言 之前寫過一篇 超簡單! 一文理解如何使用私有大型語言模型LLM - Ollama+Open WebUI篇 這篇將教你如何使最近很紅的DeepSeek R1模型,讓我們來一探究竟! 1
Thumbnail
DeepSeek降低AI運算需求,短期可能影響高階GPU銷售,但長期將因應用普及和市場擴張而刺激GPU市場增長。
Thumbnail
人工智慧領域正在迅速發展,而其中最令人興奮的應用之一是生成式應用。在這個應用領域中,DeepSeek R1 是一個尖端的語言模型,專門設計用於協助開發者撰寫、最佳化和理解程式碼。透過運用其他大型語言模型 (LLM)的力量,DeepSeek 公司發展了一個新版的語言模型。
創文者雪源-avatar-img
創文者雪源
2025/02/22
回覆
回覆
研究指出,若在每次迭代中缺乏足量且新鮮的真實資料,生成模型的品質與多樣性都會逐漸退化,最終將陷入所謂的模型自嗜的狀態。
Thumbnail
普普文創-avatar-img
普普文創
2025/01/24
4
回覆
4
回覆
鋼哥-avatar-img
鋼哥
2025/01/24
發文者
1
回覆
1
回覆