方格子 vocus

WaveNet

iPAS AI應用規劃師學習筆記

發佈於AWS AIF-C01

2025/08/08 更新2025/07/08 發佈閱讀 2 分鐘

WaveNet 是由 DeepMind 研發的一種深度卷積神經網路架構，專門用於生成高品質的原始音訊波形，最初設計目標是用於文字轉語音（Text-to-Speech, TTS）系統，能產生非常自然且逼真的人聲。

主要特點與運作原理

自回歸生成模型（Autoregressive Model）
WaveNet 以自回歸方式運作，逐一預測音訊序列中的每個取樣點，當前取樣點的生成會依賴於之前所有的取樣點。
膨脹因果卷積（Dilated Causal Convolution）
使用膨脹卷積來擴大感受野（receptive field），使模型能有效捕捉長時間範圍的音訊依賴關係，同時保持計算效率。
因果性（Causality）
模型只利用過去的音訊取樣來預測下一個取樣，確保生成的音訊符合時間序列的因果關係。
門控激活單元（Gated Activation Unit）
每層由兩個平行卷積組成，一個使用 sigmoid 激活函數，另一個使用 tanh 激活函數，兩者相乘後輸出，有助於捕捉複雜的非線性特徵。
高品質音訊生成
WaveNet 可生成包括呼吸聲、嘴唇聲等自然語音細節，生成的語音聽起來更自然、人性化。

應用範圍

文字轉語音（TTS）系統
語音合成與轉換
音樂生成
其他音訊生成任務

優缺點

總結

WaveNet 是一種基於深度膨脹因果卷積的自回歸神經網路，能夠從原始音訊波形中學習並生成高品質、自然的語音和音訊，對語音合成技術帶來革命性提升。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記AWS AIF-C01

留言

郝信華 iPAS AI應用規劃師學習筆記

43會員

571內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師初級+中級(數據分析) AWS Certified AI Practitioner (AIF-C01) 其他：富邦美術館志工

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/07/08

Residual neural network

殘差神經網路（Residual Neural Network，簡稱 ResNet）是一種深度神經網路架構，主要用於解決深層網路訓練時的「梯度消失」與「退化問題」，使得網路可以堆疊更多層數且仍能有效學習。主要概念殘差學習（Residual Learning） ResNet 引入了「殘差塊（R

2025/07/08

Residual neural network

2025/07/08

支持向量機（Support Vector Machine， SVM）

支持向量機（Support Vector Machine，簡稱 SVM）是一種監督式機器學習演算法，主要用於分類和回歸任務。它的核心目標是找到一條（或多維空間中的一個超平面）最佳分隔線，將不同類別的資料點分開，並且最大化兩類之間的邊界（margin），以提升模型的泛化能力。 SVM 的主要特點：

2025/07/08

支持向量機（Support Vector Machine， SVM）

2025/07/08

Amazon SageMaker Model Cards

Amazon SageMaker Model Cards 是一種用來在單一集中位置記錄機器學習模型重要資訊的工具，旨在簡化模型治理與報告流程。它提供一個結構化的格式，幫助使用者在模型的整個生命週期中（從設計、建置、訓練到評估）記錄關鍵細節，包含：模型的訓練細節與評估結果模型的預期用途與業務目

2025/07/08

Amazon SageMaker Model Cards

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇：帕拉贊諾夫的十段殘篇》，如何以十段殘篇，結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭，探討藝術在儀式消失的現代社會如何承接意義，並展現不羈的自由靈魂。

#釀電影#釀評論#藝術評論

2026/02/11

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

#釀電影#釀評論#藝術評論

2026/02/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11