【🎓 Python的深度問答集】torchaudio 對部分段落進行音訊解碼

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

【野格團開箱｜上篇】首波新成員登場！5 題靈魂拷問，直擊「個人主題專家」的創作後台🔥

vocus 最具指標性的創作者社群──「野格團」， 2026 年春季，這支充滿專業、熱情的團隊再次擴編，迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇，他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。

#創作#創作者推薦#靈感

2026/03/25

方格子 vocus 官方沙龍

【野格團開箱｜上篇】首波新成員登場！5 題靈魂拷問，直擊「個人主題專家」的創作後台🔥

vocus 最具指標性的創作者社群──「野格團」， 2026 年春季，這支充滿專業、熱情的團隊再次擴編，迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇，他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。

#創作#創作者推薦#靈感

2026/03/25

螃蟹_crab的沙龍

[OpenCV][Python]印出圖像中文字的位置及高寬

本文將說明如何去辨識出圖片文字位置及高寬。

#文字的位置及高寬#OCR#OpenCV

2024/07/24

螃蟹_crab的沙龍

[OpenCV][Python]印出圖像中文字的位置及高寬

本文將說明如何去辨識出圖片文字位置及高寬。

#文字的位置及高寬#OCR#OpenCV

2024/07/24

貓貓學習筆記

TextToSpeech-聲學特徵轉換

我們前面幾篇已經講完TTS技術的一大半架構了，知道了如何將聲學特徵重建回音訊波形，也從中可以知道要是聲學特徵不完善，最終取得的結果也會不自然，剩下要探討該如何將文字轉換成聲學特徵，且能夠自然地表現停頓及細節變化，讓我們開始吧。

#AI#TTS

2024/07/08

貓貓學習筆記

TextToSpeech-聲學特徵轉換

我們前面幾篇已經講完TTS技術的一大半架構了，知道了如何將聲學特徵重建回音訊波形，也從中可以知道要是聲學特徵不完善，最終取得的結果也會不自然，剩下要探討該如何將文字轉換成聲學特徵，且能夠自然地表現停頓及細節變化，讓我們開始吧。

#AI#TTS

2024/07/08

螃蟹_crab的沙龍

[OCR][Python]tesseract 4.0 辨識模型Fine tune

微調(Fine tune)是深度學習中遷移學習的一種方法，其中預訓練模型的權重會在新數據上進行訓練。本文主要介紹如何使用新的訓練圖檔在tesseract 辨識模型進行Fine tune 有關於安裝的部分可以參考友人的其他文章 Tesseract OCR - 繁體中文【安裝篇】將所有資料

#tesseract#OCR#python

2024/06/21

螃蟹_crab的沙龍

[OCR][Python]tesseract 4.0 辨識模型Fine tune

微調(Fine tune)是深度學習中遷移學習的一種方法，其中預訓練模型的權重會在新數據上進行訓練。本文主要介紹如何使用新的訓練圖檔在tesseract 辨識模型進行Fine tune 有關於安裝的部分可以參考友人的其他文章 Tesseract OCR - 繁體中文【安裝篇】將所有資料

#tesseract#OCR#python

2024/06/21

leqi.ai

如何利用OCR技術提高PDF文檔處理效率

學習如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#學習#學術#電子

2024/06/11

leqi.ai

如何利用OCR技術提高PDF文檔處理效率

學習如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#學習#學術#電子

2024/06/11

貓貓學習筆記

圖像風格轉換(一)-風格轉換初探

　　最近遇到一些人想做音訊的合成，我回答他或許可以從圖像風格轉換中找到些靈感，我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何，對於內部訓練邏輯及結構並沒有認真的去了解，現在剛好趁此機會好好的學習一下。

#AI#StyleTransfer#Pytorch

2024/05/06

貓貓學習筆記

圖像風格轉換(一)-風格轉換初探

　　最近遇到一些人想做音訊的合成，我回答他或許可以從圖像風格轉換中找到些靈感，我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何，對於內部訓練邏輯及結構並沒有認真的去了解，現在剛好趁此機會好好的學習一下。

#AI#StyleTransfer#Pytorch

2024/05/06

人生半百：心態二十

免費的聲音轉文字只要三行程式碼

這篇文章介紹瞭如何將聲音檔轉換為逐字稿，並且提到了使用雲端硬碟安裝colaboratory的方法。這篇文章指出了逐字稿的重要性，以及如何透過逐字稿做文字呈現方式的轉變。如果你需要處理會議紀錄或聲音檔，這些方法都能幫助你更輕鬆的進行工作。

#音檔#安裝#雲端

2024/04/04

人生半百：心態二十

免費的聲音轉文字只要三行程式碼

這篇文章介紹瞭如何將聲音檔轉換為逐字稿，並且提到了使用雲端硬碟安裝colaboratory的方法。這篇文章指出了逐字稿的重要性，以及如何透過逐字稿做文字呈現方式的轉變。如果你需要處理會議紀錄或聲音檔，這些方法都能幫助你更輕鬆的進行工作。

#音檔#安裝#雲端

2024/04/04

GPT工作術｜與你一起補給工作的AI能量沙龍

不用花時間配音啦！AI「文字轉語音」讓有聲內容製作更簡單高效！

文字MP3專業版是簡單且強大的工具，會編輯文字就能創造出專業級配音。簡單 ﹑容易上手，像使用Word，無需剪輯經驗，輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇，包括純正的臺灣口音。這個工具能應用於各種情境，如教育訓練簡報、有聲書、Podcast等。

#Podcast#配音員#成本

2024/03/21

GPT工作術｜與你一起補給工作的AI能量沙龍

不用花時間配音啦！AI「文字轉語音」讓有聲內容製作更簡單高效！

文字MP3專業版是簡單且強大的工具，會編輯文字就能創造出專業級配音。簡單 ﹑容易上手，像使用Word，無需剪輯經驗，輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇，包括純正的臺灣口音。這個工具能應用於各種情境，如教育訓練簡報、有聲書、Podcast等。

#Podcast#配音員#成本

2024/03/21

阿Han的沙龍

【Python 軍火庫🧨 - EasyOCR】讓我們對圖片進行文字辨識吧

EasyOCR是一個能夠幫助你對圖片中的文字進行辨識的工具，透過進階分析，可以應用在文件掃描、自動化數據輸入、發票掃描等領域。本章節將介紹如何安裝、引用模型、進行文字辨識、以及辨識結果的分析。透過學習，你可以建立屬於自己的文字辨識系統。

#模型#GPU#文章

2024/02/20

阿Han的沙龍

【Python 軍火庫🧨 - EasyOCR】讓我們對圖片進行文字辨識吧

EasyOCR是一個能夠幫助你對圖片中的文字進行辨識的工具，透過進階分析，可以應用在文件掃描、自動化數據輸入、發票掃描等領域。本章節將介紹如何安裝、引用模型、進行文字辨識、以及辨識結果的分析。透過學習，你可以建立屬於自己的文字辨識系統。

#模型#GPU#文章

2024/02/20

螃蟹_crab的沙龍

[OpenCV基礎][Python]影像操作(讀取、顯示、保存、裁剪、旋轉、縮放)

本文將介紹影像的基本操作包括：影像的讀取、顯示、保存，以及一些常見的操作如裁剪、旋轉、縮放等。語法介紹讀取影像： cv2.imread函數的參數是影像的檔案路徑。讀取後的影像以NumPy的ndarray形式表示。

#Python#OpenCV影像基礎#OpenCV影像操作

2024/01/29

螃蟹_crab的沙龍

[OpenCV基礎][Python]影像操作(讀取、顯示、保存、裁剪、旋轉、縮放)

本文將介紹影像的基本操作包括：影像的讀取、顯示、保存，以及一些常見的操作如裁剪、旋轉、縮放等。語法介紹讀取影像： cv2.imread函數的參數是影像的檔案路徑。讀取後的影像以NumPy的ndarray形式表示。

#Python#OpenCV影像基礎#OpenCV影像操作

2024/01/29

螃蟹_crab的沙龍

[OCR_應用]Tesseract-OCR_擷取字元面積

使用Google Tesseract應用，擷取圖像的OCR並將讀取到的字元標註在原圖上光學字元辨識功能 (Optical character recognition，光學字符辨識）可以將影像中特徵範圍內的文本轉換為數字形式的文本。使用前必須安装Google Tesseract並更新

#OCR應用#Tesseract#OCR長寬面積

2024/01/06

螃蟹_crab的沙龍

[OCR_應用]Tesseract-OCR_擷取字元面積

使用Google Tesseract應用，擷取圖像的OCR並將讀取到的字元標註在原圖上光學字元辨識功能 (Optical character recognition，光學字符辨識）可以將影像中特徵範圍內的文本轉換為數字形式的文本。使用前必須安装Google Tesseract並更新

#OCR應用#Tesseract#OCR長寬面積

2024/01/06

【🎓 Python的深度問答集】torchaudio 對部分段落進行音訊解碼

基本用法

讀一點、解一點

以行動支持創作者！付費即可解鎖