大型語言模型

含有「大型語言模型」共 48 篇內容
全部內容
發佈日期由新至舊
文章提供關於大型語言模型 (LLM) 的課程筆記,涵蓋 LLM 的定義、特性、優勢、技術架構、開發方式與傳統機器學習的差異、三種類型,以及提示設計 (Prompt Design) 與提示工程 (Prompt Engineering) 的重要性。課程旨在幫助行銷人等專業人士瞭解 LLM 的基礎知識。
Thumbnail
Peter Lu-avatar-img
2025/04/27
謝謝分享~ 簡單易懂的資訊!
本文整理 Google 數位人才探索計畫課程「Introduction to Generative AI」的重點,介紹生成式 AI 的定義、運作原理與應用範疇,並釐清 AI、機器學習與深度學習關聯。課程涵蓋大型語言模型(LLM)、Transformer 架構,並說明在文字、圖像、程式、語音領域應用。
Thumbnail
謝謝您的筆記與分享,很有幫助!
Andrej Karpathy是AI領域的知名專家,曾在特斯拉和OpenAI工作,專注於深度學習和電腦視覺。影片中示範了大型語言模型(LLM)的實用應用,從基本互動到進階功能,如搜尋工具、檔案處理、自訂GPT、模型選擇、工具使用(如搜尋和深度研究)、程式碼撰寫、音視頻處理、圖像生成等。
Thumbnail
Andrej Karpathy是AI領域的知名專家,曾在特斯拉和OpenAI工作,專注於深度學習和電腦視覺。影片中示範了大型語言模型(LLM)的實用應用,從基本互動到進階功能,如搜尋工具、檔案處理、自訂GPT、模型選擇、工具使用(如搜尋和深度研究)、程式碼撰寫、音視頻處理、圖像生成等。
Thumbnail
DeepSeek崛起,中國AI新勢力衝擊全球!本文深入探討DeepSeek技術突破、AI產業發展趨勢、企業應用與監管挑戰。阿峰老師剖析AI發展的「油門與煞車」,並分享AI時代個人與企業的應變之道,帶領讀者掌握AI新知,提升競爭力。
Thumbnail
Andrej Karpathy 深入淺出地介紹大型語言模型的訓練流程,將其比喻成學生學習過程)的三個階段,並佐以生活化的例子,讓讀者更容易理解大型語言模型的運作方式。
Thumbnail
付費限定
圍繞 DeepSeek AI 開發的爭議核心在於指控其從 OpenAI 的專有系統中進行模型蒸餾,引發了知識產權(IP)和 AI 倫理實踐的質疑。以下是詳細分析: OpenAI 的關鍵指控 OpenAI 聲稱 DeepSeek 使用「蒸餾」技術以極低成本複製了 GPT-4o 和 o1-pre
Thumbnail
這篇文章分享使用GPT4ALL軟體安裝及操作DeepSeek R1模型的過程,並說明本地端部署的優勢,例如資料隱私和安全性。文章涵蓋環境準備、軟體安裝、模型下載和掛載,以及實際操作與測試範例,並深入探討本地端部署的硬體需求和未來發展。
Thumbnail
本文將帶你快速了解如何使用DeepSeek R1 + 類似ChatGPT的介面可以與大型語言模型互動 前言 之前寫過一篇 超簡單! 一文理解如何使用私有大型語言模型LLM - Ollama+Open WebUI篇 這篇將教你如何使最近很紅的DeepSeek R1模型,讓我們來一探究竟! 1
Thumbnail
DeepSeek降低AI運算需求,短期可能影響高階GPU銷售,但長期將因應用普及和市場擴張而刺激GPU市場增長。
Thumbnail