【💊 Python的解憂錦囊】取得沒有副檔名檔案名稱(filename without the extension)

【💊 Python的解憂錦囊】取得沒有副檔名檔案名稱(filename without the extension)

更新於 發佈於 閱讀時間約 4 分鐘


圖片來源

圖片來源

請耐心閱讀到最後, 我們會提供更優雅的方式來處理這項需求…

故事起源

我們常常在使用Python的過程中會進行I/O的一些處理, 那麼最基本的就會是讀取檔案列表並對每一個特定的檔案名稱進行處理, 像這樣:

import glob

mp4_files = glob.glob(os.path.join(pwd, '**/*.mp4'))

那假設我們的檔案擺放預期如下, 會有一個影片檔配一個字幕檔:

|- dir
|- xxx.srt
|- xxx.mp4


情境題

❓ 今天我們打算開發一個小工具, 那麼小工具的功能主要是「檢查每個影片檔都需要有字幕檔」。

遇到上述的情境, 你會怎麼做?

嗯…非常簡單, 我們在列舉檔案清單的過程中(在前面的故事起源有提到讀取檔案列表), 那該檔案清單的內容為:

txt_files

# dir/1.mp4
# dir/2.mp4
...
# dir/${檔名}.mp4

接下來我們只要設法解析出「檔名」的部份再結合字串組合成「1.srt」去檢查該檔案是否存在即可, 看到這裡會有個關鍵點需要處理:

  1. 如何取得沒有副檔名(.mp4)的檔名。
  2. 檔案路徑組合。
  3. 檢查檔案(.srt)是否存在。


帶你解題

有鑑於上述的情境題, 我們應該要好好發揮軟體開發的專長來進行解題一番, 那麼首先我們稍微看了一下Python的標準函式庫之中有個不錯的功能可以使用也就是 ➡️「os.path」, 讓我們來 ⛏️ 挖挖看有沒有寶藏吧!

看來有一個東西還不錯, 可能會是我們需要的答案:

import os

file_path = 'dir/1.mp4'
# 1.mp4
basename = os.path.basename(file_path)

我們可以看到它雖然可以幫我們去除路徑, 也順利取得檔案名稱, 但這個結果顯然還不是非常理想, 仍然具有副檔名(.mp4)。

進一步來說我們還可以土炮一點這樣做

# basename = 1.mp4
# 1
print(os.path.splitext(basename)[0])

更好的方法...

嗯…雖然達成了我們的目的, 但好像有點冗長啊! 有沒有更好的技巧呢? 答案是有的, 就讓我們來為您說明一番吧, 咱們來看看「pathlib」這個酷東西唄, 它提供了更優雅的方式來處理檔案路徑的一些操作, 以上述情境為例我們可以這樣做:

from pathlib import Path

file_path = 'dir/1.mp4'

# 透過.stem取得無後綴的純路徑
print(Path(file_path).stem)

P.S ⚠️ 這個模組需要Python 3.4以上的版本才能使用喔!

另外對於「.stem」這個API有興趣的朋友, 這裡提供連結給您查閱:

🌐 PurePath.stem


喜歡撰寫文章的你,不妨來了解一下:

Web3.0時代下為創作者、閱讀者打造的專屬共贏平台 — 為什麼要加入?

歡迎加入一起練習寫作,賺取知識

avatar-img
阿Han的沙龍
126會員
280內容數
哈囉,我是阿Han,是一位 👩‍💻 軟體研發工程師,喜歡閱讀、學習、撰寫文章及教學,擅長以圖代文,化繁為簡,除了幫助自己釐清思路之外,也希望藉由圖解的方式幫助大家共同學習,甚至手把手帶您設計出高品質的軟體產品。
留言
avatar-img
留言分享你的想法!
阿Han的沙龍 的其他內容
關於字幕檔我們常常會看到「.srt」、「.ass」、「.vtt」…等影片的字幕格式, 但你知道嗎? 這些字幕檔是很重要的一個寶貴資訊, 可以從中對段落的長度、文字進行提取, 此時就需要一個強大的工具來幫我們解析一下字幕檔, 就讓我們來看看怎麼用吧! 安裝 pip install pysubs2
這次要來介紹「pytube」這套神器, 當我們需要對影音進行統計分析時就需要使用這把利器來破關, 尤其是AI時代的來臨, 我們會需要大量的資料來進行模型的訓練, 而我們總不可能海量的去撈取這些資料, 會非常沒有效率也浪費空間, 因此我們會先進行偵查的任務, 需要派出偵察隊來蒐集youtube的影音資
講到Docker之前就必須先談談容器化, 容器化是一種軟體開發的方法, 將程式、依賴及組態封裝在映像檔之中, 那映像檔對於大部份的人來說一定非常的熟悉, 尤其是VM這個詞, 虛擬化技術的先行者, 有了這項技術之後, 我們就可以減少一些因為環境產生的問題導致難以排查程式錯誤的狀況, 甚至可以避免因為A
一早看著IThome的新聞發現到這個標題「📢 PyPI新帳號現需要啟用雙因素驗證才能執行管理操作」, 而近期幾乎都在接觸Python語言, 在Python的生態圈裡相信對於「pip install…」應該相當熟悉了吧! 但對於背後的平台相信我們不曾仔細去了解一番, 這好藉著這次的觀點也順便來介紹一
學習資料科學的過程中相信最熱門的目前應該是Python程式語言了,而Python的世界裡再進行資料科學時最常用的有「Pandas」、「SciPy」、「Scikit-learn」...等,而這些的基礎幾乎都與「NumPy」離不開關係,因為「NumPy」就是地基,這些較為高階的套件則是基於地基發展而起。
過往我們有介紹了「【Google Colab Python系列】 資料處理神器 Pandas 起手式」, 相信對於pandas的基本操作具有一定的基礎知識了, 主要著重在基本的操作, 讓我們快速篩選與分析資料, 但真實的世界是有可能具有很多類型的資料集分別儲存, 而不同的資料集又具有一些相似度, 需
關於字幕檔我們常常會看到「.srt」、「.ass」、「.vtt」…等影片的字幕格式, 但你知道嗎? 這些字幕檔是很重要的一個寶貴資訊, 可以從中對段落的長度、文字進行提取, 此時就需要一個強大的工具來幫我們解析一下字幕檔, 就讓我們來看看怎麼用吧! 安裝 pip install pysubs2
這次要來介紹「pytube」這套神器, 當我們需要對影音進行統計分析時就需要使用這把利器來破關, 尤其是AI時代的來臨, 我們會需要大量的資料來進行模型的訓練, 而我們總不可能海量的去撈取這些資料, 會非常沒有效率也浪費空間, 因此我們會先進行偵查的任務, 需要派出偵察隊來蒐集youtube的影音資
講到Docker之前就必須先談談容器化, 容器化是一種軟體開發的方法, 將程式、依賴及組態封裝在映像檔之中, 那映像檔對於大部份的人來說一定非常的熟悉, 尤其是VM這個詞, 虛擬化技術的先行者, 有了這項技術之後, 我們就可以減少一些因為環境產生的問題導致難以排查程式錯誤的狀況, 甚至可以避免因為A
一早看著IThome的新聞發現到這個標題「📢 PyPI新帳號現需要啟用雙因素驗證才能執行管理操作」, 而近期幾乎都在接觸Python語言, 在Python的生態圈裡相信對於「pip install…」應該相當熟悉了吧! 但對於背後的平台相信我們不曾仔細去了解一番, 這好藉著這次的觀點也順便來介紹一
學習資料科學的過程中相信最熱門的目前應該是Python程式語言了,而Python的世界裡再進行資料科學時最常用的有「Pandas」、「SciPy」、「Scikit-learn」...等,而這些的基礎幾乎都與「NumPy」離不開關係,因為「NumPy」就是地基,這些較為高階的套件則是基於地基發展而起。
過往我們有介紹了「【Google Colab Python系列】 資料處理神器 Pandas 起手式」, 相信對於pandas的基本操作具有一定的基礎知識了, 主要著重在基本的操作, 讓我們快速篩選與分析資料, 但真實的世界是有可能具有很多類型的資料集分別儲存, 而不同的資料集又具有一些相似度, 需