打工仔也想學 AI:在本地跑出第一個 LLM

更新於 發佈於 閱讀時間約 5 分鐘

我在我Substack上的電子報開設了一個新專題,分享自己由 0 開始學習 AI 開發的過程,例如 RAG、AI Agent,有興趣可以訂閱我的電子報。

還記得我上回提到的那個「喝醉酒的 Chatbot」嗎?

事情是這樣的:

我想做一個公司內部 Chatbot,試試看 AI 技術,於是沒想太多就動手準備了一些資料餵給模型去做 Fine-tuning。

結果誕生了一個前言不對後語、會講亂碼的模型…

我曾把這段經歷分享到某個討論區,有人問我:

為什麼不用 RAG?

嗯…

其實那時候的我不知道 RAG 是什麼。


Finetune V.S. RAG

為了不再讓我的模型宿醉,我開始研究 RAG,也重新思考 Fine-tuning 應該用在哪裏。

後來我大致畫下了這條分界線:

  • Finetune 較適合處理調整語氣、補上專業領域知識 (例如醫療、法律)
  • RAG (Retrieval Augmented Generation) 較適合根據最新資料回答問題,資料更新只需換 Embeddings (之後會深入探討此概念,暫時可理解為代表文字意思的數字),無須再次訓練模型

用日常例子來說的話:

Finetune 像大學選科,要花大把的金錢及時間,但畢業後就變成一個腦中有知識的人。

RAG 像開卷考試 (Open Book Exam),不用全都懂,只要買本書,找到資料就能作答。資料更新了,換書就好。

而我想做的 Chatbot 剛好有幾個特點:

  1. 資料更新頻密
  2. 團隊缺乏 AI / ML 人才
  3. 資料內容不算太專業

所以,RAG 才是更適合的選擇。

以下是一些關於 RAG 和 Finetuning 的補充資料:


想做 RAG,第一步得有自己的模型

作為一位新手,我一開始只知道 ChatGPT。

但不想付費用 OpenAI 的 API,又不想把公司資料上傳雲端的話,那怎麼辦呢?

調查一圈後,發現可以考慮的有幾個:

  • Hugging Face
  • LM Studio
  • Ollama

最後我選了 Ollama,因為:

  1. 支援 CLI 操作 (工程師的最愛)
  2. 公司資料留在本地,不怕外洩
  3. 教學資源豐富,容易上手

Ollama 是什麼?

一句話:

一個能在本地跑 LLM 的工具

可以用它來下載、部署、跑模型,熟 CLI 的話會覺得很順手。

它支援不少開源 (Open Source) 模型,例如:

  • deepseek (因低成本爆紅)
  • gemma (Google)
  • llama (Meta)
  • phi (Microsoft)

當中不乏參數少、佔硬碟少的模式,適合本地開發測試,可以到它的模型列表查看。


模型的名字怎麼來?

第一眼看到的時候覺得跟 Docker 映像的命名方法很相似,簡單來說是:

<品牌/系列><版本>:<參數量>
<Brand/Series><Version>:<Number of Parameters>

例如:

  • gemma3:4b (Google Gemma 系列的第 3 版本,40 億參數量)
  • llama3.1:8b (Meta Llama 系列的第 3.1 版本,80 億參數量)
  • phi3:3.8b (Microsfot Phi 系列的第 3 版本,38 億參數量)

參數越多,表現通常越好,但也更吃資源。選模型前,記得看清楚自己的電腦扛不扛得住。


LLM 不是萬能的,也不是穩定的

跑了幾輪 LLM 後,有些心得想要記錄下來:

沒有全能的模型

剛開始試了幾個模型,發現每個都有些不支援的功能:

  • Gemma 不支援 embeddings
  • DeepSeek 不支援 tool use

而且 Ollama 官網上寫的功能,有時也不太準…

所以我現在都當在「招新人」,一個個試用,不行就換。

同一個 Prompt 同一個模型,答案不一定一致

LLM 是根據機率運作的,就算同一個 Prompt 問 10 次,答案也可能有點不同。

這對習慣確定性的工程師來說,是種心理挑戰,因為不是寫個固定 input 就能得到固定的 output。

不是所有任務都適合 LLM

LLM 的能力大家有目共睹,我亦相信未來 LLM 能替我們做很多不同的工作,但如果我想要的答案是固定、不容模糊的答案的話 (例如報稅、計算邏輯),有時候寫死規則比用模型更快、更穩。

如果你對實作細節有興趣的話,歡迎閱讀我此篇電子報

留言
avatar-img
留言分享你的想法!
avatar-img
Keith的沙龍
0會員
17內容數
Keith的沙龍的其他內容
2025/08/02
我在我Substack上的電子報開設了一個新專題,分享自己由 0 開始學習 AI 開發的過程,例如 RAG、AI Agent,有興趣可以訂閱我的電子報。
Thumbnail
2025/08/02
我在我Substack上的電子報開設了一個新專題,分享自己由 0 開始學習 AI 開發的過程,例如 RAG、AI Agent,有興趣可以訂閱我的電子報。
Thumbnail
2025/07/08
我會在Substack上分享更多關於北美職場上的所見所聞,有興趣可以訂閱我的電子報。
2025/07/08
我會在Substack上分享更多關於北美職場上的所見所聞,有興趣可以訂閱我的電子報。
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
產品經理想做 AI 產品要懂哪些基本名詞?這篇整理我過往參與 AI 自傳生成時,和 NLP 工程師有討論到的概念,AI 應用目前還尚未普及,未來我會再陸續整理不同功能或產業需要知道的 AI 基礎知識。
Thumbnail
產品經理想做 AI 產品要懂哪些基本名詞?這篇整理我過往參與 AI 自傳生成時,和 NLP 工程師有討論到的概念,AI 應用目前還尚未普及,未來我會再陸續整理不同功能或產業需要知道的 AI 基礎知識。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
老實說,原本的我一直認為,AI是離我很遠的東西,即使是去年的 ChatGPT 熱潮,我也只是跟著偶爾在工作中跟AI聊天激發靈感而已。不過,就在前一陣子看了《AI 世界的底層邏輯與生存法則》這本書後,我才逐漸加深使用AI的頻率,並且把「讓AI成為工作中的標配」當作讓自己能習慣的方向。
Thumbnail
老實說,原本的我一直認為,AI是離我很遠的東西,即使是去年的 ChatGPT 熱潮,我也只是跟著偶爾在工作中跟AI聊天激發靈感而已。不過,就在前一陣子看了《AI 世界的底層邏輯與生存法則》這本書後,我才逐漸加深使用AI的頻率,並且把「讓AI成為工作中的標配」當作讓自己能習慣的方向。
Thumbnail
AI 履歷、AI 自傳、AI 找工作是近期很熱門的應用,但 AI 自傳要如何實現?身為產品經理要如何設計這個功能?如何套用到履歷編輯器內?這篇想分享我過往的產品發想經歷。
Thumbnail
AI 履歷、AI 自傳、AI 找工作是近期很熱門的應用,但 AI 自傳要如何實現?身為產品經理要如何設計這個功能?如何套用到履歷編輯器內?這篇想分享我過往的產品發想經歷。
Thumbnail
你對 AI 的認識有多少?你在生活或工作上有運用哪些 AI 的應用服務嗎?一起來了解這個目前很夯的議題。 根據 google 對 AI(artificial intelligence,縮寫為AI)的解釋:AI 是人工智慧,定義是打造電腦與機器的科學領域,可以進行推論、學習以及採取行動。這些過往需要
Thumbnail
你對 AI 的認識有多少?你在生活或工作上有運用哪些 AI 的應用服務嗎?一起來了解這個目前很夯的議題。 根據 google 對 AI(artificial intelligence,縮寫為AI)的解釋:AI 是人工智慧,定義是打造電腦與機器的科學領域,可以進行推論、學習以及採取行動。這些過往需要
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及接下來更多的AI運用場景,每一項都將對人類社會產生重大的影響:包括抽象的人心、文化、審美、親密關係,以及實質的就業、經濟、生活、生涯規劃等。 本文我會以大量使用、測試AI的經驗,輔以田野調查的經驗,詳細說明AI時代最應該培養的四項能力。
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及接下來更多的AI運用場景,每一項都將對人類社會產生重大的影響:包括抽象的人心、文化、審美、親密關係,以及實質的就業、經濟、生活、生涯規劃等。 本文我會以大量使用、測試AI的經驗,輔以田野調查的經驗,詳細說明AI時代最應該培養的四項能力。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News