【Python 疑難雜症 - Pytube】RegexMatchError: channel_name: could..

閱讀時間約 4 分鐘
raw-image

您是否苦於網路資訊爆炸嗎? 教學何其多,但卻無法好好選擇的困境呢? 歡迎加入「🔒 阿Han的軟體心法實戰營」, 這裡不給您冗餘的雜訊, 單刀直入直接送您重點, 避開選擇障礙的困境, 讓您獲得業界標準的開發起手式, 成為Top 1的頂尖人才。


✅ 今天我們預計學到…

  • 遇到問題追原因。
  • Github Issues、MR調閱。
  • 安裝未正式發版套件。


我們在「【資料處理神器區 - Pytube系列】 蒐集情報讓數據會說話」有介紹怎麼分析Youtube影音資訊,但過程中卻遇到了一些問題...,沒關係,動動手做個Maker來解決麻煩吧!

前景提要

圖片來源

圖片來源

故事是這樣的, 小明在使用pytube進行Youtube頻道的分析時, 發現到奇怪, 原本抓影片可以啊, 像這樣:

from pytube import YouTube

yt = YouTube('${影片網址}')

但不知道為什麼用在Channel上就這樣了:

from pytube import Channel

channel = Channel('<https://www.youtube.com/@LightUpCoding>')
raw-image

小明也是滿臉??? 究竟發生啥事情呢? 於是找到我們進行求助, 那就讓我們來幫他看看吧!

什麼原因

要怎麼抓問題呢? 最簡單的方式就是回到Github的Issues搜尋看看。

🔍 討論中的Issue

圖片來源

圖片來源

我們可以看到相關的問題持續討論中…, 而且從, 就可以發現到事情並不單純, 那身為偵探迷的我們只好用力的追求真相拉!

可以怎麼解決?

這邊看到有人有發送 🔀 Merge Request, 但在2022/12/30就已經有了這筆MR, 也尚未被合併進去。

🕵️‍♂️ added functionality for @username URL's #144

圖片來源

圖片來源

另一筆是:🕵️‍♂️ https://github.com/pytube/pytube/pull/1409, 我們是使用這筆

如果想要使用該解決方案的朋友可以直接去安裝該版本,這部份個人也尚未實驗過, 因此如果有心得的朋友也歡迎分享留言。

至於怎麼安裝指定的commit版本呢?

!pip install git+https://github.com/pytube/pytube.git@42a7d8322dd7749a9e950baf6860d115bbeaedfc

只要找到相關的Pull Request, 而你覺得可行的話就可以去安裝它來試試看。

P.S 為什麼別人的套件可以這麼的容易被安裝呢? 您也可以製作出這樣的神級套件,請看這裡「【🔒 Python 先修班】教你親手打包專屬套件庫的手作課(pip install…)」。

那麼重新安裝完畢後, 我們再重新抓取一次頻道資訊應該就能正常運作了。

from pytube import YouTube, Channel
import pytube

channel = Channel('<https://www.youtube.com/channel/UC5TB0Pv2k1LdtGeMB6ErtJQ>')

urls = channel.video_urls

urls
['<https://www.youtube.com/watch?v=7pEG2ZKM2CQ>', ...]

結語

pytube這套件雖然簡單且方便, 但可能較適用於教學或者是概念驗證, 畢竟更新速度並沒有那麼快, 看著累積許久的Issue尚未解決就令人覺得非常不安心, 因此假若您想要抓取大量數據時, 這邊會推薦 yt-dlp 這套工具, 對於傳輸進行優化, 維護頻率也高出許多, 使用起來相對安心許多。


喜歡撰寫文章的你,不妨來了解一下:

Web3.0時代下為創作者、閱讀者打造的專屬共贏平台 — 為什麼要加入?

歡迎加入一起練習寫作,賺取知識!

avatar-img
116會員
262內容數
哈囉,我是阿Han,是一位 👩‍💻 軟體研發工程師,喜歡閱讀、學習、撰寫文章及教學,擅長以圖代文,化繁為簡,除了幫助自己釐清思路之外,也希望藉由圖解的方式幫助大家共同學習,甚至手把手帶您設計出高品質的軟體產品。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
阿Han的沙龍 的其他內容
我們在「【Python 軍火庫 - PySubs2】 字幕檔提取工具的好幫手(ass、ssa、srt、vtt…)」有稍微跟大家介紹了字幕檔處理工具的基本用法,相信對於讀取字幕,更改文字內容應該是再容易不過的事了,咦…,但我們好像都沒有看到關於新增「段落」的資訊耶,不曉得是我沒有仔細尋找還是真的沒
我們在「」有稍微介紹了JSON格式, 也知曉JSON格式非常簡單暴力, 只要一對<key>與<value>就能成行, 對於工程人員來說已經比XML、文字檔…等傳統格式更加容易理解, 而且也具備一定的資料型態基礎, 但使用這麼久以來常常發現到想要對某個欄位註解時好像不太容易, 頂多就是多一個欄位叫做「
JSON 全名 JavaScript Object Notation,其格式基本上就是key: value的組成如下: { "name": "Bob", "age": 40, "childs": [ { "name": "Justin", "
請耐心閱讀到最後, 我們會提供更優雅的方式來處理這項需求… 故事起源 我們常常在使用Python的過程中會進行I/O的一些處理, 那麼最基本的就會是讀取檔案列表並對每一個特定的檔案名稱進行處理, 像這樣: import glob mp4_files = glob.glob(os.path
關於字幕檔我們常常會看到「.srt」、「.ass」、「.vtt」…等影片的字幕格式, 但你知道嗎? 這些字幕檔是很重要的一個寶貴資訊, 可以從中對段落的長度、文字進行提取, 此時就需要一個強大的工具來幫我們解析一下字幕檔, 就讓我們來看看怎麼用吧! 安裝 pip install pysubs2
這次要來介紹「pytube」這套神器, 當我們需要對影音進行統計分析時就需要使用這把利器來破關, 尤其是AI時代的來臨, 我們會需要大量的資料來進行模型的訓練, 而我們總不可能海量的去撈取這些資料, 會非常沒有效率也浪費空間, 因此我們會先進行偵查的任務, 需要派出偵察隊來蒐集youtube的影音資
我們在「【Python 軍火庫 - PySubs2】 字幕檔提取工具的好幫手(ass、ssa、srt、vtt…)」有稍微跟大家介紹了字幕檔處理工具的基本用法,相信對於讀取字幕,更改文字內容應該是再容易不過的事了,咦…,但我們好像都沒有看到關於新增「段落」的資訊耶,不曉得是我沒有仔細尋找還是真的沒
我們在「」有稍微介紹了JSON格式, 也知曉JSON格式非常簡單暴力, 只要一對<key>與<value>就能成行, 對於工程人員來說已經比XML、文字檔…等傳統格式更加容易理解, 而且也具備一定的資料型態基礎, 但使用這麼久以來常常發現到想要對某個欄位註解時好像不太容易, 頂多就是多一個欄位叫做「
JSON 全名 JavaScript Object Notation,其格式基本上就是key: value的組成如下: { "name": "Bob", "age": 40, "childs": [ { "name": "Justin", "
請耐心閱讀到最後, 我們會提供更優雅的方式來處理這項需求… 故事起源 我們常常在使用Python的過程中會進行I/O的一些處理, 那麼最基本的就會是讀取檔案列表並對每一個特定的檔案名稱進行處理, 像這樣: import glob mp4_files = glob.glob(os.path
關於字幕檔我們常常會看到「.srt」、「.ass」、「.vtt」…等影片的字幕格式, 但你知道嗎? 這些字幕檔是很重要的一個寶貴資訊, 可以從中對段落的長度、文字進行提取, 此時就需要一個強大的工具來幫我們解析一下字幕檔, 就讓我們來看看怎麼用吧! 安裝 pip install pysubs2
這次要來介紹「pytube」這套神器, 當我們需要對影音進行統計分析時就需要使用這把利器來破關, 尤其是AI時代的來臨, 我們會需要大量的資料來進行模型的訓練, 而我們總不可能海量的去撈取這些資料, 會非常沒有效率也浪費空間, 因此我們會先進行偵查的任務, 需要派出偵察隊來蒐集youtube的影音資
你可能也想看
Google News 追蹤
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
從範例學python的目標讀者: 針對剛進入的初學者,想學習Python語言。 有基礎本數學邏輯基礎即可。 從小遊戲學python的目標讀者: 針對已經有經驗的C/C++, Python, 或其他有程式基礎的讀者。 想實作一些小專案,從實做中學習如何分析需求、元件分拆、到底層實作
Thumbnail
想要使用python學習程式應該要怎麼開始呢? 首先就是要下載Python(程式語言)還有Pychar(整合開發環境,IDE)這兩個軟體。 在Google的搜尋欄位打上Python下載, 點選第一個Download Python。 第二步點選Download,選擇你的電腦系統。
Thumbnail
不知道大家是曾有過這樣的經驗,每次在YT上想要看外文影片,打開字幕->自動翻譯->繁體中文時,總是不會出現字幕,只好退而求其次選擇簡體中文。 今天這篇文章來與大家分享,如何拯救YOUTUBE繁體字幕,讓迷路的文字回歸正軌!! Step1: 前往Chrome 擴充套件(Youtube繁體自動套
Thumbnail
因為最近有在經營Youtube,也有看了一些教學,以及有些經營小心得
Thumbnail
使用 Gemini AI 聊天服務時,點擊「設定>擴充功能」啟用「YouTube」功能,即可在對話中利用 @YouTube 指令尋找 YouTube 影片和詢問內容。
Thumbnail
在實務上,若Python報錯時,若引入的套件越多伴隨的異常訊息會變得越來越複雜,看到一推密密麻麻的內容時,很多時候都想直接跳過。 本文將利用Traceback來讓異常訊息變得更好理解。
Thumbnail
本篇內容介紹如何使用 Python中的 moviepy library 簡單的剪影片。 先安裝moviepy library , 用pip install moviepy , 可參考官方文件。 要剪的影片和python檔要在同個資料夾中,若不在同個位置要用 os library 更換路徑
Thumbnail
你是否也像我一樣,在一開始經營YouTube頻道時,遇到下面的問題: 不知道問題出在哪?沒人看?剪輯很差?
Thumbnail
想成為百萬訂閱 YouTuber?別光顧著拍片,這些隱藏設定才是你成功的秘密武器!
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
從範例學python的目標讀者: 針對剛進入的初學者,想學習Python語言。 有基礎本數學邏輯基礎即可。 從小遊戲學python的目標讀者: 針對已經有經驗的C/C++, Python, 或其他有程式基礎的讀者。 想實作一些小專案,從實做中學習如何分析需求、元件分拆、到底層實作
Thumbnail
想要使用python學習程式應該要怎麼開始呢? 首先就是要下載Python(程式語言)還有Pychar(整合開發環境,IDE)這兩個軟體。 在Google的搜尋欄位打上Python下載, 點選第一個Download Python。 第二步點選Download,選擇你的電腦系統。
Thumbnail
不知道大家是曾有過這樣的經驗,每次在YT上想要看外文影片,打開字幕->自動翻譯->繁體中文時,總是不會出現字幕,只好退而求其次選擇簡體中文。 今天這篇文章來與大家分享,如何拯救YOUTUBE繁體字幕,讓迷路的文字回歸正軌!! Step1: 前往Chrome 擴充套件(Youtube繁體自動套
Thumbnail
因為最近有在經營Youtube,也有看了一些教學,以及有些經營小心得
Thumbnail
使用 Gemini AI 聊天服務時,點擊「設定>擴充功能」啟用「YouTube」功能,即可在對話中利用 @YouTube 指令尋找 YouTube 影片和詢問內容。
Thumbnail
在實務上,若Python報錯時,若引入的套件越多伴隨的異常訊息會變得越來越複雜,看到一推密密麻麻的內容時,很多時候都想直接跳過。 本文將利用Traceback來讓異常訊息變得更好理解。
Thumbnail
本篇內容介紹如何使用 Python中的 moviepy library 簡單的剪影片。 先安裝moviepy library , 用pip install moviepy , 可參考官方文件。 要剪的影片和python檔要在同個資料夾中,若不在同個位置要用 os library 更換路徑
Thumbnail
你是否也像我一樣,在一開始經營YouTube頻道時,遇到下面的問題: 不知道問題出在哪?沒人看?剪輯很差?
Thumbnail
想成為百萬訂閱 YouTuber?別光顧著拍片,這些隱藏設定才是你成功的秘密武器!