【2025 夏日精選-1】擁抱 AI 的臉孔

發佈於2025 夏日精選

2025/07/27 更新2025/07/09 發佈閱讀 4 分鐘

不知道畢專要做什麼，反正現在流行 AI，那就先來研究一下吧！

雖然上一篇還在吐槽，這個時代學習新知識會跑去找 ChatGPT，但不得不說生成式 AI 是真香，或者更精確地說「大型語言模型（LLM, Large Language Model）」（以下簡稱LLM），有用過的朋友應該都知道他的優點：

1. 高效率、節省時間
2. 提供靈感、增強創造力
3. 非專業人士也能用
4. 高度客製化與可擴展性

但就是這麼一個神隊友，卻有著讓大公司不敢使用的風險存在，就是「資料安全」的問題

使用 LLM 處理機密資料（如行銷策略、關鍵技術、個資）時，可能會有資料外洩的風險，你也無法保證輸入的資料會不會被用來當成模型訓練的素材

所以，既不希望資料外洩又想用 LLM 的話，就只能...自己做一個！但那樣成本又太高，動輒千萬美金絕對不是一般企業願意投入的（像我們這種窮大學生就更不可能了🥲）

所以就只能下載已經訓練好的「開源模型」並且在本地部署，這裡我們要先來介紹一個神隊友 Hugging Face

Hugging Face

Hugging Face 人稱「AI界的Github」，他上面不只有全球最多的已經訓練好的模型與訓練資料庫、整合不同模型的API，

最重要的是他開發了一個標準化的函式庫 Transformers 將不同的模型進行串連，大幅降低開發門檻，讓深度學習不再止步於研究用途，而是能夠產生商業價值、普及於社會大眾之中改善生活品質的一項技術

有以下三種很好用的函式庫 (Library) ：

Transformers

整合各式 LLM 的神級函式庫，可以

快速進行文本分類、生成、翻譯、問答、摘要等任務
支援 PyTorch / TensorFlow / Flax 等函式庫
寫一行就能使用模型的封裝工具包 pipeline

Tokenizers

超高速的文字拆分與編碼套件，可以將輸入文字轉換為 token（分詞單元），這些 token 是模型用來理解和處理文字的基本單元

你可能會想說，為什麼要把一句話拆分？其實這對 NLP（自然語言處理）非常重要，因為模型需要先將文字轉換為 token 才能進行處理，並逐字、逐詞進行理解

Datasets

乾淨統一的資料集工具（乾淨的資料是指沒有錯誤、破損、格式不正確或重複...的資料）

訓練大型語言模型 (LLM) 最重要也最麻煩的就是取得大量又完整的資料，Datasets 是讓使用者能夠跟 Hugging Face Hub 取得資料集的 API

使用者可以從 Hugging Face 下載模型來用，總共有 180 萬個以上的開源模型可以使用，包含常見的 GPT-2、Deepseek、Ollama...，還可以導入他的各種超方便 Library(函式庫) 前面提到的 Transformers 就是其中之一

見識到 Hugging Face 有多厲害之後，接著就是要實作啦！我們下一篇將會來看到 Transformers 到底有多好用～

*抱歉好一段時間沒有更新了，因為最近比較忙加上又是新東西，所以就了比較久

の倉的程式小天地2025 夏日精選建構AI

留言

留言分享你的想法！

の倉的程式小天地

6會員

32內容數

熱愛做志工的大學生誤打誤撞跑去讀資管系既然來到了資管系，那就學習新技能來幫助他人

の倉的程式小天地的其他內容

2025/07/01

【2025 夏日精選-0】屬於我們的暑假

大二下的期末，與他的相遇是那麼地奇妙又命中注定，屬於我們的暑假......開始了

2025/07/01

【2025 夏日精選-0】屬於我們的暑假

大二下的期末，與他的相遇是那麼地奇妙又命中注定，屬於我們的暑假......開始了

2025/06/29

不再迷茫！手把手的Python入門教學-封裝

前兩篇講完了繼承（Inheritance）、多型（Polymorphism）跟抽象類別（Abstract Class），今天講一下「封裝（Encapsulation）」，準備好我們就開始吧！

2025/06/29

不再迷茫！手把手的Python入門教學-封裝

前兩篇講完了繼承（Inheritance）、多型（Polymorphism）跟抽象類別（Abstract Class），今天講一下「封裝（Encapsulation）」，準備好我們就開始吧！

2025/06/28

不再迷茫！手把手的Python入門教學-多型、抽象類別

今天來講一下「多型（Polymorphism）」跟「抽象類別（Abstract Class）」，這兩個技巧可以讓程式更具擴充性喔！

2025/06/28

不再迷茫！手把手的Python入門教學-多型、抽象類別

今天來講一下「多型（Polymorphism）」跟「抽象類別（Abstract Class）」，這兩個技巧可以讓程式更具擴充性喔！

看更多

你可能也想看

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

在當今快速變化的數位時代，企業面臨著前所未有的數據處理需求。為了應對這些挑戰，企業紛紛建立自己的大型語言模型（LLM），利用大量數據進行訓練，讓模型能夠理解並生成自然語言，從而實現人機協作，優化業務流程並提升客戶體驗。

#廣告雜誌#專欄#cacaFly

2024/07/31

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

#廣告雜誌#專欄#cacaFly

2024/07/31

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

2024/07/30

2024/06/09

2024/06/09

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

2024/06/06

2024/06/06

大型語言模型 (LLM) 在最近幾年取得了重大進展，並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力，但它們對工作的影響仍然是一個複雜且充滿爭議的話題。本文摘要自MIT 史隆管理評論，分析LLM 對工作帶來的影響。

2024/03/08

2024/03/08

心情繪本｜ChatGPT ｜DALL.E ｜[晶智紀元：AI深度學習的奇蹟]

在晶狀智慧的時代，人類與AI共舞，共同建構更先進、更智能的未來。這是一場革命，一場改變人類命運的奇蹟，讓我們共同見證這個智慧的新紀元。

#奇蹟#學習#人類

2024/03/05

D&Y熊繪生的沙龍

心情繪本｜ChatGPT ｜DALL.E ｜[晶智紀元：AI深度學習的奇蹟]

在晶狀智慧的時代，人類與AI共舞，共同建構更先進、更智能的未來。這是一場革命，一場改變人類命運的奇蹟，讓我們共同見證這個智慧的新紀元。

#奇蹟#學習#人類

2024/03/05

Everything ✨

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT#AI#人工智慧

2024/02/24

Everything ✨

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

#ChatGPT#AI#人工智慧

2024/02/24

咖啡因學習教室

2024 讓你 8分鐘懂機器學習： 01 機器學習 vs 人工智慧

2023年被世人稱做生成式AI世代的元年，各式各樣的AI工具不斷湧現，改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識，以及各種人工智慧和機器學習的實現方法。

#人工智慧#生成式AI#機器學習

2024/01/31

咖啡因學習教室

2024 讓你 8分鐘懂機器學習： 01 機器學習 vs 人工智慧

#人工智慧#生成式AI#機器學習

2024/01/31

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News