【Hugging Face】Ep.1 平凡人也能玩的起的AI平台

更新於 2023/07/15發佈於 2023/07/03閱讀時間約 6 分鐘

它到底是什麼？

簡單說Hugging Face是人工智慧開源平台，開發者發表和共享預訓練模型、資料庫和示範檔案等。Hugging Face共享超過10萬個預訓練模型，上萬資料庫，包括微軟、Google、彭博、英特爾等各行業上萬機構都有使用Hugging Face。

理念與目標

我們都知道最近火紅的OpenAI公開的ChatGPT非常熱門，但在開發者服務方面， OpenAI正在搭起人工智慧的圍牆，僅允許滿足條件的企業或個人進入，而「Hugging Face」希望每個人都能做出生成式AI的模型，有點像是Github的概念，讓整個資訊科技可以快速推進。

巨頭努力築起AI的圍牆的戰場之下，「Hugging Face」有點像強力的民兵，擁抱開放，讓一般的平民老百姓也有機會接觸到高深的AI技術，不再讓這些尖端技術掌握在巨頭手中，因此也吸引了不少的擁護者，其實一開始的「Hugging Face」是針對年輕人開發的聊天機器人，且技術基於NLP(自然語言處理)， Transformer模型的出現瞬間成為自然語言領域最受開發者關注的模型，也讓Hugging Face一炮而紅。

商業模式

「Hugging Face」以賦能為出發點讓整個AI社群發揚光大，因此只要在其中獲得1％的變現就能夠撐起一間公司，類似於elastic、mongodb…等。

Hugging Face Hub

相信只要是開發者都知道Github是一個儲存程式碼的倉庫，但AI模型呢？總要有個地方集中控管吧！

如果有興趣的朋友請至這裡參考參考: https://huggingface.co/docs/hub/index

我們可以發現到除了模型以外，資料集、靜態網頁空間、報告空間..，非常的豐富，讓我們可以將開發好的專案完整的放置Hub之上，透過學習交流的方式加快人工智慧的進程。

組成的元件

使用Hugging Face務必要了解最重要的三大元件，基本上各種任務的模型(語音辨識、影像分類、NLP…)，都是離不開這三大元件的。

Transformers

顧名思義就是為了處理各種Transformer模型而開發的元件。

Tokenizers

我們都知道NLP的世界裡，文字的最小的單位就是詞，而要將文字化成詞的關鍵就是斷詞， Tokenizers就是扮演著這個角色，提供了不同的策略也支援前處理、後處理。

Datasets

我們都知道AI訓練的重要養分來源就是資料集，而Datasets元件就是扮演著如何將資料集管理好的角色，並提供豐富的API(隨機分類、切割、整合pandas)，讓我們更容易的處理資料。

簡易的使用方式讓我們輕鬆上手

這邊我們就使用wav2vec2的語音辨識模型試玩看看吧！

使用起來非常簡單, 我們只要使用pipeline搭配指定的任務，就能進行簡單的AI任務，以這裡的範例為例，我們會使用「automatic-speech-recognition」語音辨識的任務來進行。

並指定「ydshieh/wav2vec2-large-xlsr-53-chinese-zh-cn-gpt」這個中文模型進行語音辨識。

如何找模型呢？

我們可以在Hugging fa ce首頁直接進行搜尋。

也可以到模型區進行精確的篩選。

最後直接將音檔進行辨識，產生文字，整個操作流程非常簡易。

import torch

# 引入pipeline
from transformers import pipeline

# 定義任務
asr = pipeline(
    "automatic-speech-recognition", 
    model='ydshieh/wav2vec2-large-xlsr-53-chinese-zh-cn-gpt', 
)

# 執行任務
result = asr('./test.wav')

text = result['text']

text

更多的使用方式請參考「https://huggingface.co/docs/transformers/quicktour」。

喜歡撰寫文章的你，不妨來了解一下：

Web3.0時代下為創作者、閱讀者打造的專屬共贏平台 - 為什麼要加入？

歡迎加入一起練習寫作，賺取知識！

更多關於【Hugging Face 系列】…

阿Han的沙龍阿Han的軟體技術棧 💡AI

留言

留言分享你的想法！

阿Han的沙龍

130會員

288內容數

哈囉，我是阿Han，是一位 👩‍💻 軟體研發工程師，喜歡閱讀、學習、撰寫文章及教學，擅長以圖代文，化繁為簡，除了幫助自己釐清思路之外，也希望藉由圖解的方式幫助大家共同學習，甚至手把手帶您設計出高品質的軟體產品。

阿Han的沙龍的其他內容

2025/04/23

【🤖 cursor AI】如何使用MCP Server

我們在「【🤖 cursor AI】如何在ubuntu 24.04安裝」有分享如何在Ubuntu安裝cursro這套AI編輯器，使用起來大幅度的提昇開發效率，但仍有些問題點需要克服，比如說： LLM壓根不知道我們的數據庫長怎樣啊？怎麼分析結構呢？假設文檔又不足的狀況下更是艱辛，如果LLM

2025/04/23

【🤖 cursor AI】如何使用MCP Server

2025/03/12

【語音合成技術 - MeloTTS】如何建置API服務？

我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」分享了語音合成技術，該套GPT-SoVITS也非常的出色，但效能有點不是非常理想，加上需要GPU才能達到較佳的體驗，如此一來成本就會有點高了，因此我們找了另外一套MeloTTS，這一套強調CPU推理非常的快！

2025/03/12

【語音合成技術 - MeloTTS】如何建置API服務？

2025/03/05

【語音合成技術 - GPT-SoVITS】解析API版本

我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」分享如何架設API V3版本的TTS服務，但發音的部份似乎只有早期的API版本才使用到g2pw這類的技術，因此我們可能會需要將API退回舊版，在這裡我們也整理了早期版本api與api_v2的一些差異，期望幫助到正在面臨選

2025/03/05

【語音合成技術 - GPT-SoVITS】解析API版本

#AI創作的其他內容

AI工具怎麼幫助我們學習程式－ChatGPT的實踐與範例

Ken Chen 的沙龍

AWS SageMaker 開箱體驗

西尼亞ming的沙龍

沒有機器學習經驗的我嘗試了 Amazon SageMaker JumpStart

你可能也想看

方格子 vocus 官方沙龍

沙龍介面新登場！自訂你的創作空間，讓好內容被看見

沙龍一直是創作與交流的重要空間，這次 vocus 全面改版了沙龍介面，就是為了讓好內容被好好看見！你可以自由編排你的沙龍首頁版位，新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。改版完成後可以在社群媒體分享新版面，並標記 @vocus.official⁠ ♥️ ⁠

#vocus#方格子#方格子沙龍

2025/06/12

方格子 vocus 官方沙龍

沙龍介面新登場！自訂你的創作空間，讓好內容被看見

#vocus#方格子#方格子沙龍

2025/06/12

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

科技巨頭解碼

NVDA 25Q1 財報 - 扣除中國因素，輝達的前方仍然沒有烏雲 | #276

全球科技產業的焦點，AKA 全村的希望 NVIDIA，於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1，實際日曆期間為今年二到四月)，交出了打敗了市場預期的成績單。然而，在銷售持續高速成長的同時，川普政府加大對於中國的晶片管制......

#NVDA#NVIDIA#輝達

2025/06/18

科技巨頭解碼

NVDA 25Q1 財報 - 扣除中國因素，輝達的前方仍然沒有烏雲 | #276

#NVDA#NVIDIA#輝達

2025/06/18

美股 Insight

6月Fed會議：略為鷹派收斂2026、2027年降息預期，繼續維持高利率更長時間的觀望態度

重點摘要： 6 月繼續維持基準利率不變，強調維持高利率主因為關稅點陣圖表現略為鷹派，收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變，強調需要維持高利率是因為關稅：聯準會 (Fed) 召開 6 月利率會議

#Fed#聯準會#美股

2025/06/18

美股 Insight

6月Fed會議：略為鷹派收斂2026、2027年降息預期，繼續維持高利率更長時間的觀望態度

#Fed#聯準會#美股

2025/06/18

阿Han的沙龍

【Hugging Face】Ep.7 以文生圖的魔幻製圖師(Text To Image)

我們過往介紹了幾個關於文字AI應用的篇章：【Hugging Face】Ep.5 文字世界中的超能力語言英雄(Named Entity Recognition) 【Hugging Face】Ep.6 解決問題的專業級破關知識家(Question Answering) 但單獨的文字應用似乎不太能

#AI#AI創作#技術組

2023/07/31

阿Han的沙龍

【Hugging Face】Ep.7 以文生圖的魔幻製圖師(Text To Image)

#AI#AI創作#技術組

2023/07/31

茶桁的沙龍

07 AI帮你做总结

Hi，我是茶桁。在上一节中，我们介绍了如何使用最新的ChatGPT API，注册HuggingFace账户，并将我们的聊天机器人部署出去。在这个过程中，我们学习了实际的应用开发过程，使你对聊天机器人的开发有了充足的体验。在这一讲中，我们将探讨OpenAI的各种接口提供的能力，以更深入地了解这些

2023/07/31

2023/07/31

Hi，我是茶桁。在过去的两讲中，我们已经使用 OpenAI 提供的 Embedding 接口完成了文本分类的功能。现在，我们回到 Completion 接口，这一讲将带你更深入地了解该接口的使用。除此之外，我们还将快速搭建一个有界面的聊天机器人，这将让你更好地理解 Completion 接口的应

2023/07/31

2023/07/31

【Hugging Face】Ep.6 解決問題的專業級破關知識家(Question Answering)

QA問答是自然語言處理NLP中蠻困難的一項任務，必須從一段文本中識別出使用者的提問，像搜尋引擎就是一種QA的應用，從眾多的問題中找答案，那就讓我們親手來打造一下自己專屬的QA系統吧！找看看有哪些可用模型在「【Hugging Face】Ep.3 前往Dataset掏金趣」我們有介紹過Hu

#ChatGPT#Huggingface#AI

2023/07/12

阿Han的沙龍

【Hugging Face】Ep.6 解決問題的專業級破關知識家(Question Answering)

#ChatGPT#Huggingface#AI

2023/07/12

于正龍（Ricky）的沙龍

免費使用ChatGPT 4

大家好，今天我精選了一系列服務，讓您可以免費使用廣受好評的神經網絡“ChatGPT 4”（而不是每月 20 美元），無需註冊、使用 VPN 和其他注意事項。 1.“ForeFront AI” ForeFront AI 是一項提供免費訪問“GPT-4”模型的服務。要使用它，只需註冊，選擇模型“GPT

2023/07/05

2023/07/05

【Hugging Face】Ep.2 初探新手村, 打造專屬的翻譯官

我們已經介紹過關於Transformer模型的平台「【Hugging Face】Ep.1 平凡人也能玩的起的AI平台」，而這次就來實際動手進行開發，讓我們自己的AI自己做。由於AI模型的訓練往往都會比較耗時，因此建議需要有GPU環境會比較有效率一些，否則訓練模行動輒好幾個小時才能看到結果，一

#AI#Huggingface#ChatGPT

2023/07/04

阿Han的沙龍

【Hugging Face】Ep.2 初探新手村, 打造專屬的翻譯官

#AI#Huggingface#ChatGPT

2023/07/04

阿Han的沙龍

【Hugging Face】Ep.1 平凡人也能玩的起的AI平台

它到底是什麼？簡單說Hugging Face是人工智慧開源平台，開發者發表和共享預訓練模型、資料庫和示範檔案等。Hugging Face共享超過10萬個預訓練模型，上萬資料庫，包括微軟、Google、彭博、英特爾等各行業上萬機構都有使用Hugging Face。理念與目標我們都知道最近火紅的O

#AI#ChatGPT#AI創作

2023/07/03

阿Han的沙龍

【Hugging Face】Ep.1 平凡人也能玩的起的AI平台

#AI#ChatGPT#AI創作

2023/07/03

藍白拖主力的沙龍

Open AI 發展概況與ChatGPT實際測試報告

Open AI 是AI實驗室，並無企業架構與政府背景。成立目的是希望透過不同領域的AI專家與愛好者一同發展可以廣泛使用的AI（強人工智慧，接近人類可以思考、推理、具有意識），而非過往各自研究並開發出只具備單一領域能應用的AI（弱人工智慧，下圍棋、人臉辨識、判讀醫學檢驗結果）。

#ChatGPT#OpenAI#聊天機器人

2023/03/08

藍白拖主力的沙龍

Open AI 發展概況與ChatGPT實際測試報告

#ChatGPT#OpenAI#聊天機器人

2023/03/08

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News

它到底是什麼？

理念與目標

商業模式

Hugging Face Hub

組成的元件

Transformers

Tokenizers

Datasets

更多其他的元件

簡易的使用方式讓我們輕鬆上手

更多關於【Hugging Face 系列】…