【🎓 Python的深度問答集】torchaudio 對部分段落進行音訊解碼

蝦皮分潤計畫讓我在分享旅遊文章時，也能透過推薦好物累積被動收入，貼補旅行基金。這篇文章，除了介紹計畫的操作亮點與心得，也分享我最常應用的案例：「旅行必備小物 TOP5」，包含行李鎖、免洗內衣褲、分裝瓶、折疊衣架與真空壓縮袋，幫助出國打包更輕鬆。想同時記錄旅行、分享好物又創造額外收入的你，千萬別錯過！

#出國旅行必備小物#旅行必備清單#長途旅行行李怎麼帶

2025/09/13

小芝女看天下

用文字創造旅行基金：我的蝦皮分潤計畫體驗

蝦皮分潤計畫讓我在分享旅遊文章時，也能透過推薦好物累積被動收入，貼補旅行基金。這篇文章，除了介紹計畫的操作亮點與心得，也分享我最常應用的案例：「旅行必備小物 TOP5」，包含行李鎖、免洗內衣褲、分裝瓶、折疊衣架與真空壓縮袋，幫助出國打包更輕鬆。想同時記錄旅行、分享好物又創造額外收入的你，千萬別錯過！

#出國旅行必備小物#旅行必備清單#長途旅行行李怎麼帶

2025/09/13

Lees Space

蝦皮分潤計畫｜申請、操作教學，輕鬆賺取被動收入！

想增加被動收入？加入蝦皮分潤計畫是輕鬆上手的好方法！本文提供完整教學，包含申請流程、賺取分潤技巧，以及實際使用心得分享，助你輕鬆獲得額外收入。

#蝦皮分潤計畫#蝦皮分潤#蝦皮分潤計畫是什麼

2025/09/12

Lees Space

蝦皮分潤計畫｜申請、操作教學，輕鬆賺取被動收入！

想增加被動收入？加入蝦皮分潤計畫是輕鬆上手的好方法！本文提供完整教學，包含申請流程、賺取分潤技巧，以及實際使用心得分享，助你輕鬆獲得額外收入。

#蝦皮分潤計畫#蝦皮分潤#蝦皮分潤計畫是什麼

2025/09/12

螃蟹_crab的沙龍

[OpenCV][Python]印出圖像中文字的位置及高寬

本文將說明如何去辨識出圖片文字位置及高寬。

#文字的位置及高寬#OCR#OpenCV

2024/07/24

螃蟹_crab的沙龍

[OpenCV][Python]印出圖像中文字的位置及高寬

本文將說明如何去辨識出圖片文字位置及高寬。

#文字的位置及高寬#OCR#OpenCV

2024/07/24

貓貓學習筆記

TextToSpeech-聲學特徵轉換

我們前面幾篇已經講完TTS技術的一大半架構了，知道了如何將聲學特徵重建回音訊波形，也從中可以知道要是聲學特徵不完善，最終取得的結果也會不自然，剩下要探討該如何將文字轉換成聲學特徵，且能夠自然地表現停頓及細節變化，讓我們開始吧。

#AI#TTS

2024/07/08

貓貓學習筆記

TextToSpeech-聲學特徵轉換

我們前面幾篇已經講完TTS技術的一大半架構了，知道了如何將聲學特徵重建回音訊波形，也從中可以知道要是聲學特徵不完善，最終取得的結果也會不自然，剩下要探討該如何將文字轉換成聲學特徵，且能夠自然地表現停頓及細節變化，讓我們開始吧。

#AI#TTS

2024/07/08

螃蟹_crab的沙龍

[OCR][Python]tesseract 4.0 辨識模型Fine tune

微調(Fine tune)是深度學習中遷移學習的一種方法，其中預訓練模型的權重會在新數據上進行訓練。本文主要介紹如何使用新的訓練圖檔在tesseract 辨識模型進行Fine tune 有關於安裝的部分可以參考友人的其他文章 Tesseract OCR - 繁體中文【安裝篇】將所有資料

#tesseract#OCR#python

2024/06/21

螃蟹_crab的沙龍

[OCR][Python]tesseract 4.0 辨識模型Fine tune

微調(Fine tune)是深度學習中遷移學習的一種方法，其中預訓練模型的權重會在新數據上進行訓練。本文主要介紹如何使用新的訓練圖檔在tesseract 辨識模型進行Fine tune 有關於安裝的部分可以參考友人的其他文章 Tesseract OCR - 繁體中文【安裝篇】將所有資料

#tesseract#OCR#python

2024/06/21

leqi.ai

如何利用OCR技術提高PDF文檔處理效率

學習如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#學習#學術#電子

2024/06/11

leqi.ai

如何利用OCR技術提高PDF文檔處理效率

學習如何將掃描的PDF轉換為可搜索文本，並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。

#學習#學術#電子

2024/06/11

貓貓學習筆記

圖像風格轉換(一)-風格轉換初探

　　最近遇到一些人想做音訊的合成，我回答他或許可以從圖像風格轉換中找到些靈感，我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何，對於內部訓練邏輯及結構並沒有認真的去了解，現在剛好趁此機會好好的學習一下。

#AI#StyleTransfer#Pytorch

2024/05/06

貓貓學習筆記

圖像風格轉換(一)-風格轉換初探

　　最近遇到一些人想做音訊的合成，我回答他或許可以從圖像風格轉換中找到些靈感，我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何，對於內部訓練邏輯及結構並沒有認真的去了解，現在剛好趁此機會好好的學習一下。

#AI#StyleTransfer#Pytorch

2024/05/06

人生半百：心態二十

免費的聲音轉文字只要三行程式碼

這篇文章介紹瞭如何將聲音檔轉換為逐字稿，並且提到了使用雲端硬碟安裝colaboratory的方法。這篇文章指出了逐字稿的重要性，以及如何透過逐字稿做文字呈現方式的轉變。如果你需要處理會議紀錄或聲音檔，這些方法都能幫助你更輕鬆的進行工作。

#音檔#安裝#雲端

2024/04/04

人生半百：心態二十

免費的聲音轉文字只要三行程式碼

這篇文章介紹瞭如何將聲音檔轉換為逐字稿，並且提到了使用雲端硬碟安裝colaboratory的方法。這篇文章指出了逐字稿的重要性，以及如何透過逐字稿做文字呈現方式的轉變。如果你需要處理會議紀錄或聲音檔，這些方法都能幫助你更輕鬆的進行工作。

#音檔#安裝#雲端

2024/04/04

GPT工作術｜與你一起補給工作的AI能量沙龍

不用花時間配音啦！AI「文字轉語音」讓有聲內容製作更簡單高效！

文字MP3專業版是簡單且強大的工具，會編輯文字就能創造出專業級配音。簡單 ﹑容易上手，像使用Word，無需剪輯經驗，輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇，包括純正的臺灣口音。這個工具能應用於各種情境，如教育訓練簡報、有聲書、Podcast等。

#Podcast#配音員#成本

2024/03/21

GPT工作術｜與你一起補給工作的AI能量沙龍

不用花時間配音啦！AI「文字轉語音」讓有聲內容製作更簡單高效！

文字MP3專業版是簡單且強大的工具，會編輯文字就能創造出專業級配音。簡單 ﹑容易上手，像使用Word，無需剪輯經驗，輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇，包括純正的臺灣口音。這個工具能應用於各種情境，如教育訓練簡報、有聲書、Podcast等。

#Podcast#配音員#成本

2024/03/21

阿Han的沙龍

【Python 軍火庫🧨 - EasyOCR】讓我們對圖片進行文字辨識吧

EasyOCR是一個能夠幫助你對圖片中的文字進行辨識的工具，透過進階分析，可以應用在文件掃描、自動化數據輸入、發票掃描等領域。本章節將介紹如何安裝、引用模型、進行文字辨識、以及辨識結果的分析。透過學習，你可以建立屬於自己的文字辨識系統。

#模型#GPU#文章

2024/02/20

阿Han的沙龍

【Python 軍火庫🧨 - EasyOCR】讓我們對圖片進行文字辨識吧

EasyOCR是一個能夠幫助你對圖片中的文字進行辨識的工具，透過進階分析，可以應用在文件掃描、自動化數據輸入、發票掃描等領域。本章節將介紹如何安裝、引用模型、進行文字辨識、以及辨識結果的分析。透過學習，你可以建立屬於自己的文字辨識系統。

#模型#GPU#文章

2024/02/20

螃蟹_crab的沙龍

[OpenCV基礎][Python]影像操作(讀取、顯示、保存、裁剪、旋轉、縮放)

本文將介紹影像的基本操作包括：影像的讀取、顯示、保存，以及一些常見的操作如裁剪、旋轉、縮放等。語法介紹讀取影像： cv2.imread函數的參數是影像的檔案路徑。讀取後的影像以NumPy的ndarray形式表示。

#Python#OpenCV影像基礎#OpenCV影像操作

2024/01/29

螃蟹_crab的沙龍

[OpenCV基礎][Python]影像操作(讀取、顯示、保存、裁剪、旋轉、縮放)

本文將介紹影像的基本操作包括：影像的讀取、顯示、保存，以及一些常見的操作如裁剪、旋轉、縮放等。語法介紹讀取影像： cv2.imread函數的參數是影像的檔案路徑。讀取後的影像以NumPy的ndarray形式表示。

#Python#OpenCV影像基礎#OpenCV影像操作

2024/01/29

螃蟹_crab的沙龍

[OCR_應用]Tesseract-OCR_擷取字元面積

使用Google Tesseract應用，擷取圖像的OCR並將讀取到的字元標註在原圖上光學字元辨識功能 (Optical character recognition，光學字符辨識）可以將影像中特徵範圍內的文本轉換為數字形式的文本。使用前必須安装Google Tesseract並更新

#OCR應用#Tesseract#OCR長寬面積

2024/01/06

螃蟹_crab的沙龍

[OCR_應用]Tesseract-OCR_擷取字元面積

使用Google Tesseract應用，擷取圖像的OCR並將讀取到的字元標註在原圖上光學字元辨識功能 (Optical character recognition，光學字符辨識）可以將影像中特徵範圍內的文本轉換為數字形式的文本。使用前必須安装Google Tesseract並更新

#OCR應用#Tesseract#OCR長寬面積

2024/01/06

【🎓 Python的深度問答集】torchaudio 對部分段落進行音訊解碼

基本用法

讀一點、解一點

以行動支持創作者！付費即可解鎖