結語

【語音合成技術 - MeloTTS】如何建置API服務？

2025/03/12 更新2025/03/12 發佈閱讀 6 分鐘

我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」分享了語音合成技術，該套GPT-SoVITS也非常的出色，但效能有點不是非常理想，加上需要GPU才能達到較佳的體驗，如此一來成本就會有點高了，因此我們找了另外一套MeloTTS，這一套強調CPU推理非常的快！

衝著這點我們決定來試試看，因此決定依照官方的安裝指示來玩看看：

git clone <https://github.com/myshell-ai/MeloTTS.git>
cd MeloTTS
pip install -e .
python -m unidic download

奇怪了，過程怎麼裝不成功呢？出現這樣的訊息：

因此我們決定裝裝boto3來讓下載順利完成：

pip install boto3

當然我們也可以寫在 requirements.txt 裡面再重新安裝一次， 🤷‍♂️ 都可以，取決於您的習慣。

當然這次就順利安裝完成囉！接著我們看到官方的文件有展示Python的API使用方式：

可是我們希望架設一隻API是未來可以發展UI的接口，這可以怎麼辦呢？我們可以使用python的fastAPI來完成，那麼需要安裝的套件如下：

requirements.txt

fastapi
uvicorn
numpy

接著重新安裝一次，該有的套件就有了，我們就可以開始準備動手撰寫API的程式碼囉！這邊廢話不多說，直接上Code，如果對於Code的部份有需要理解的話，也歡迎使用ChatGPT、Gemini、cursor…等工具來輔助我們，讓事情更加事半功倍。

from melo.api import TTS
from fastapi import FastAPI, HTTPException
from fastapi.responses import Response
from fastapi.middleware.cors import CORSMiddleware
import numpy as np
import io
import wave
import torch

app = FastAPI()

# 設置CORS
app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)

# 初始化TTS模型
speed = 1.0
device = 'cpu'  # or cuda:0 if you have GPU
model = TTS(language='ZH', device=device)
speaker_ids = model.hps.data.spk2id

def numpy_to_wav_bytes(audio_data: np.ndarray, sample_rate: int) -> bytes:
    """將numpy數組轉換為WAV格式的字節數據"""
    buffer = io.BytesIO()
    with wave.open(buffer, 'wb') as wav_file:
        wav_file.setnchannels(1)  # 單聲道
        wav_file.setsampwidth(2)  # 16位
        wav_file.setframerate(sample_rate)
        # 確保數據在正確的範圍內並轉換為16位整數
        audio_int16 = (audio_data * 32767).astype(np.int16)
        wav_file.writeframes(audio_int16.tobytes())
    return buffer.getvalue()

@app.get("/tts")
async def text_to_speech(text: str):
    try:
        # model.tts_to_file 改為 model.tts，直接獲取音頻數據
        audio_data = model.tts_to_file(text, speaker_ids['ZH'], speed=speed)
        
        # 使用 numpy_to_wav_bytes 函數將音頻數據轉換為 WAV 格式
        wav_bytes = numpy_to_wav_bytes(audio_data, sample_rate=model.hps.data.sampling_rate)
        
        return Response(wav_bytes, media_type="audio/wav")
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=9881)

API寫好之後，我們就準備啟用它。

python tts_api.py

使用API推理試試看！

http://localhost:9881/tts?text=在遙遠的山谷中清澈的溪水流淌樹影搖曳鳥兒自由地飛翔帶來了春天

結語

TTS如雨後春筍般的出現，我們要學會如何從中挑出我們真正需要的那一個系統與模型，而這邊僅是分享一些在實際安裝或者使用這的問題，如果對於一系列文章有興趣的朋友也歡迎下方留言，浪我們更完整的去認識這些TTS的技術。

阿Han的沙龍阿Han的軟體技術棧 💡AI

留言

阿Han的沙龍

148會員

317內容數

哈囉，我是阿Han，是一位 👩‍💻 軟體研發工程師，喜歡閱讀、學習、撰寫文章及教學，擅長以圖代文，化繁為簡，除了幫助自己釐清思路之外，也希望藉由圖解的方式幫助大家共同學習，甚至手把手帶您設計出高品質的軟體產品。

阿Han的沙龍的其他內容

2025/04/23

【🤖 cursor AI】如何使用MCP Server

我們在「【🤖 cursor AI】如何在ubuntu 24.04安裝」有分享如何在Ubuntu安裝cursro這套AI編輯器，使用起來大幅度的提昇開發效率，但仍有些問題點需要克服，比如說： LLM壓根不知道我們的數據庫長怎樣啊？怎麼分析結構呢？假設文檔又不足的狀況下更是艱辛，如果LLM

2025/04/23

【🤖 cursor AI】如何使用MCP Server

2025/03/05

【語音合成技術 - GPT-SoVITS】解析API版本

我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」分享如何架設API V3版本的TTS服務，但發音的部份似乎只有早期的API版本才使用到g2pw這類的技術，因此我們可能會需要將API退回舊版，在這裡我們也整理了早期版本api與api_v2的一些差異，期望幫助到正在面臨選

2025/03/05

【語音合成技術 - GPT-SoVITS】解析API版本

2025/02/12

【語音合成技術 - GPT-SoVITS】如何微調模型

精彩回顧【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務【語音合成技術 - GPT-SoVITS】如何架設API伺服器以上是我們過往分享過關於 https://github.com/RVC-Boss/GPT-SoVITS 的分享文章，這次我們要來試試fine

2025/02/12

【語音合成技術 - GPT-SoVITS】如何微調模型

看更多

你可能也想看

步履不停 Wandering On

從家庭主婦到旅遊部落客都愛的信用卡，玉山Unicard讓你FUN心玩

身為一個精打細算，又熱愛旅遊美食的家庭主婦，皮包裡有好幾張信用卡，每次都想著哪張卡要搭配哪個通路比較划算，著實讓人燒腦，這次玉山Unicard彷彿聽到我的心聲，百大消費通路全都給你優惠，讓你無腦消費，帶一張卡就可以輕鬆省錢，FUN心玩透透！

#玉山銀行#玉山Unicard#信用卡

2025/12/15

步履不停 Wandering On

從家庭主婦到旅遊部落客都愛的信用卡，玉山Unicard讓你FUN心玩

#玉山銀行#玉山Unicard#信用卡

2025/12/15

Miller的投資沙龍

我的美股ETF篩選筆記

話說身為短線交易者，每天要作的事情就是從盤勢觀察、到籌碼流向，再到經過多維度資料數據交叉比對，盤中盯著分K、江波圖和五檔報價，算計著每一分K線的轉折，雖能換來即時驗證判斷的快感與成就，但長期下來，卻也衍生眼睛與肩頸卻成了抹不去的職業病。

2026/01/05

2026/01/05

《我的生活費被放大了♡ 五大通路消費最高回饋7.5%｜玉山 Unicard 新申辦活動倒數 1 個月！》

每天都在花錢，但你知道這些錢都能省下一筆嗎？玉山 Unicard 期間限定活動，結合日常高頻消費通路，提供最高 7.5% 的超有感回饋。文章將分享真實使用情境，教你如何聰明運用，讓每筆開銷都化為小確幸。

#玉山銀行#玉山Unicard#信用卡

2025/12/15

夢夢 🍰 甜點魔法

《我的生活費被放大了♡ 五大通路消費最高回饋7.5%｜玉山 Unicard 新申辦活動倒數 1 個月！》

#玉山銀行#玉山Unicard#信用卡