【2025 夏日精選-1】擁抱 AI 的臉孔

更新於 發佈於 閱讀時間約 4 分鐘
不知道畢專要做什麼,反正現在流行 AI,那就先來研究一下吧!

雖然上一篇還在吐槽,這個時代學習新知識會跑去找 ChatGPT,但不得不說生成式 AI 是真香,或者更精確地說「大型語言模型(LLM, Large Language Model)」(以下簡稱LLM),有用過的朋友應該都知道他的優點:

    1. 高效率、節省時間
    2. 提供靈感、增強創造力
    3. 非專業人士也能用
    4. 高度客製化與可擴展性

但就是這麼一個神隊友,卻有著讓大公司不敢使用的風險存在,就是「資料安全」的問題

使用 LLM 處理機密資料(如行銷策略、關鍵技術、個資)時,可能會有資料外洩的風險,你也無法保證輸入的資料會不會被用來當成模型訓練的素材




所以,既不希望資料外洩又想用 LLM 的話,就只能...自己做一個!但那樣成本又太高,動輒千萬美金絕對不是一般企業願意投入的(像我們這種窮大學生就更不可能了🥲)

所以就只能下載已經訓練好的「開源模型」並且在本地部署,這裡我們要先來介紹一個神隊友 Hugging Face

Hugging Face

Hugging Face 人稱「AI界的Github」,他上面不只有全球最多的已經訓練好的模型與訓練資料庫整合不同模型的API

最重要的是他開發了一個標準化的函式庫 Transformers 將不同的模型進行串連,大幅降低開發門檻,讓深度學習不再止步於研究用途,而是能夠產生商業價值、普及於社會大眾之中改善生活品質的一項技術

有以下三種很好用的函式庫 (Library) :

Transformers

整合各式 LLM 的神級函式庫,可以

  • 快速進行文本分類、生成、翻譯、問答、摘要等任務
  • 支援 PyTorch / TensorFlow / Flax 等函式庫
  • 寫一行就能使用模型的封裝工具包 pipeline

Tokenizers

超高速的文字拆分與編碼套件,可以將輸入文字轉換為 token(分詞單元),這些 token 是模型用來理解和處理文字的基本單元

你可能會想說,為什麼要把一句話拆分?其實這對 NLP(自然語言處理)非常重要,因為模型需要先將文字轉換為 token 才能進行處理,並逐字、逐詞進行理解

Datasets

乾淨統一的資料集工具(乾淨的資料是指 沒有錯誤、破損、格式不正確或重複...的資料)

訓練大型語言模型 (LLM) 最重要也最麻煩的就是取得大量又完整的資料,Datasets 是讓使用者能夠跟 Hugging Face Hub 取得資料集的 API




使用者可以從 Hugging Face 下載模型來用,總共有 180 萬個以上的開源模型可以使用,包含常見的 GPT-2、Deepseek、Ollama...,還可以導入他的各種超方便 Library(函式庫) 前面提到的 Transformers 就是其中之一

見識到 Hugging Face 有多厲害之後,接著就是要實作啦!我們下一篇將會來看到 Transformers 到底有多好用​~

*抱歉好一段時間沒有更新了,因為最近比較忙加上又是新東西,所以就了比較久

留言
avatar-img
留言分享你的想法!
avatar-img
の倉的程式小天地
6會員
32內容數
熱愛做志工的大學生 誤打誤撞跑去讀資管系 既然來到了資管系,那就學習新技能來幫助他人
2025/07/01
大二下的期末,與他的相遇是那麼地奇妙又命中注定,屬於我們的暑假......開始了
Thumbnail
2025/07/01
大二下的期末,與他的相遇是那麼地奇妙又命中注定,屬於我們的暑假......開始了
Thumbnail
2025/06/29
前兩篇講完了 繼承(Inheritance)、多型(Polymorphism)跟 抽象類別(Abstract Class),今天講一下「封裝(Encapsulation)」,準備好我們就開始吧!
Thumbnail
2025/06/29
前兩篇講完了 繼承(Inheritance)、多型(Polymorphism)跟 抽象類別(Abstract Class),今天講一下「封裝(Encapsulation)」,準備好我們就開始吧!
Thumbnail
2025/06/28
今天來講一下「多型(Polymorphism)」跟「抽象類別(Abstract Class)」,這兩個技巧可以讓程式更具擴充性喔!
Thumbnail
2025/06/28
今天來講一下「多型(Polymorphism)」跟「抽象類別(Abstract Class)」,這兩個技巧可以讓程式更具擴充性喔!
Thumbnail
看更多
你可能也想看
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
Thumbnail
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
Thumbnail
在晶狀智慧的時代,人類與AI共舞,共同建構更先進、更智能的未來。這是一場革命,一場改變人類命運的奇蹟,讓我們共同見證這個智慧的新紀元。
Thumbnail
在晶狀智慧的時代,人類與AI共舞,共同建構更先進、更智能的未來。這是一場革命,一場改變人類命運的奇蹟,讓我們共同見證這個智慧的新紀元。
Thumbnail
大型語言模型(LLM)是基於深度學習的自然語言處理模型,而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言,LMM 能夠處理跨模態的內容,並整合多種資料的能力,有望成為未來趨勢。
Thumbnail
大型語言模型(LLM)是基於深度學習的自然語言處理模型,而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言,LMM 能夠處理跨模態的內容,並整合多種資料的能力,有望成為未來趨勢。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
對於熱衷於語言科技的你, 大語言模型(LLMs)在自然語言處理(NLP)領域的發展無疑是一個革命性的進展。 從傳統的規則系統到基於深度學習的方法, LLMs展現了在理解、生成和翻譯人類語言方面的巨大突破。 這不僅是技術上的飛躍, 更是開啟了新的應用和可能性。 下面將介紹這一變革帶來的三大
Thumbnail
對於熱衷於語言科技的你, 大語言模型(LLMs)在自然語言處理(NLP)領域的發展無疑是一個革命性的進展。 從傳統的規則系統到基於深度學習的方法, LLMs展現了在理解、生成和翻譯人類語言方面的巨大突破。 這不僅是技術上的飛躍, 更是開啟了新的應用和可能性。 下面將介紹這一變革帶來的三大
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News