【💊 Python的解憂錦囊】如何使用Buffer流將檔案分段上傳至Minio

更新於 2024/08/28閱讀時間約 4 分鐘
raw-image


MinIO 是一個高性能的物件存儲系統,設計用於大規模的數據存儲需求, 甚至是各種非結構化數據也都能往這邊儲存, 也支持群集擴展, 非常適合正在尋找儲存方案的朋友們。


我們在「【💎 Message Queue - Kafka 案例篇】如何將檔案流上傳到minio - 完整檔案 」介紹了如何從kafka將資料流到minio, 但該篇的主軸在於完整的檔案一次上傳, 這一次我們要來鑽研一下如何模擬本地檔案串流上傳到minio的過程, 接著我們會另外撰寫一篇主題來談談如何結合kafka。


我們今天的主題來談談如何使用Python將檔案「串流」上傳到minio,為什麼要特別提到串流? 主要是隨著時代的演進, 應用逐漸從批次處理轉為即時處理, 使用者體驗逐漸強調「即時」, 而背後的技術從應用程式、訊息佇列、資料庫、儲存媒介也都開始支持「串流功能」, 今天我們將針對「MinIO」這套媒介進行「串流」功能的介紹, 並實際使用「Python」進行展示。


環境準備

這邊我們使用docker來運行minio, 並提供docker compose的配置檔如下:

 minio:
image: minio/minio:latest
container_name: minio
ports:
- "9000:9000"
- "9001:9001"
environment:
MINIO_ACCESS_KEY: minioadmin
MINIO_SECRET_KEY: minioadmin
command: server /data --console-address ":9001"


接著請啟動服務:

docker compose up -d


啟動服務之後我們就準備開始實作囉!


安裝套件

這邊我們需要安裝一下Minio Client才能由客戶端進行檔案上傳。

pip install minio



設定minio連線資訊並創建Bucket

client = Minio(
endpoint='minio:9000',
access_key='minioadmin',
secret_key='minioadmin',
secure=False,
)

bucket_name = 'files'

# 建立儲存桶
if not client.bucket_exists(bucket_name):
client.make_bucket(bucket_name)


設計內部Buffer流

這個內部Buffer流主要做為minio put_object與記憶體之間的檔案封包橋樑, 我們可能會從本地檔案、kafka、遠端伺服器拉取檔案封包, 我們可以將這些檔案封包暫存在我們記憶體實作的I/O流, 讓minio client自動去分塊上傳, 避免大檔案要一次拿取完才能上傳到minio伺服器。


這個Buffer流的實作是關鍵重點的部份, 它就像接水管一樣, 將來源與目的橋接, 順利讓資料流入, 大致上的設計草圖如下:

raw-image


程式碼如下:

raw-image



引流並上傳到Minio

我們將上傳到minio的部份用另外一個執行緒去進行, 這是因為我們必須讓讀寫分離才能夠很好的實驗控制的邏輯。


當我們讀完「【💎 Message Queue - Kafka 案例篇】如何將檔案流上傳到minio - 完整檔案 」 都知道上傳的關鍵函數是「put_object」, 它可以接入一條資料水管, 正好將我們設計的資料水管給接入看看。

raw-image



驗證成功與否

我們試著打開Monitoring → Trace來追蹤上傳的狀況, 這邊我們可以看到每5MB一包為單位進行上傳的過程。

raw-image



最後上傳成功才會出現檔案如下:

raw-image



結語

處理部份上傳的部份也真是不容易啊! 過程中不斷的翻閱官方文檔與試誤, 最終勉強的試出一條可以用Buffer流控制分段上傳的實現方案, 也讓我們更深入的了解到put_object的使用方式。


avatar-img
116會員
261內容數
哈囉,我是阿Han,是一位 👩‍💻 軟體研發工程師,喜歡閱讀、學習、撰寫文章及教學,擅長以圖代文,化繁為簡,除了幫助自己釐清思路之外,也希望藉由圖解的方式幫助大家共同學習,甚至手把手帶您設計出高品質的軟體產品。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
阿Han的沙龍 的其他內容
訊息的即時傳遞已然成為現代社會的趨勢了, 影音也是如此, 即時! 即時! 即時! 已經是目前使用者體驗的必要元素了, 在這邊我們要分享的主題是如何在python程式語言的情境下使用ffmpeg來將音檔串流的轉換格式, 為什麼會有這樣的需求呢? 因為我們處理音檔時可能會需要統一輸出的格式, 當然背後也
我們在學習kafka的過程中最不習慣的就是不管什麼樣的資料, 在kafka的傳輸過程都會是binary的資料格式, 因此我們在撰寫程式的過程中並不是那麼的直觀, 必須將資料從float、int…資料型態轉型成binary才能順利傳送, 那麼基於這樣的前提之下, python這套程式語言可以怎麼做
情境描述 我們在「🔒 阿Han的軟體心法實戰營 - kafka」有關於kafka的教學文章, 那麼在開發過程中我們遇到了 👻 詭異事件, 那就是我們嘗試在做一個檔案串流時, 發現Producer明明傳送了大約16MB檔案大小的封包到kafka, 每一包約(1024 * 1024 ) bytes
更快、更短、更即時是串流傳輸必要的元素, 而我們常常在使用Python請求API時都是等待式回應, 也就是一個請求過去之後, 待對方處理完畢後再行回應, 但假設需要下載的檔案、內容非常大時, 是不是使用者只能傻傻的等待整個傳輸結束後才能顯示? 這樣的使用者體驗也實在太糟糕了, 對於使用者來說除了完全
前段時間我們有介紹「【Python 軍火庫🧨 - websockets】雙向溝通的渠道」, 這種方式可以達到基本的連線沒問題,但隨著資安意識的抬頭, 我們的websocket連線也會需要在通道之上進行加密, 那麼我們將根據使用情境來教您如何選用適當的連線。 Server端 我們的Serve
情況描述 我們在「【🔒 Python 先修班】教你親手打包專屬套件庫的手作課(pip install…)」有提到如何打包Python讓自己的程式變成套件, 讓其他人可以用pip install的方式進行安裝,😲 But… 我們實際上打包後, 發現到引用的檔案都有被打包進去,但目錄卻未被打包
訊息的即時傳遞已然成為現代社會的趨勢了, 影音也是如此, 即時! 即時! 即時! 已經是目前使用者體驗的必要元素了, 在這邊我們要分享的主題是如何在python程式語言的情境下使用ffmpeg來將音檔串流的轉換格式, 為什麼會有這樣的需求呢? 因為我們處理音檔時可能會需要統一輸出的格式, 當然背後也
我們在學習kafka的過程中最不習慣的就是不管什麼樣的資料, 在kafka的傳輸過程都會是binary的資料格式, 因此我們在撰寫程式的過程中並不是那麼的直觀, 必須將資料從float、int…資料型態轉型成binary才能順利傳送, 那麼基於這樣的前提之下, python這套程式語言可以怎麼做
情境描述 我們在「🔒 阿Han的軟體心法實戰營 - kafka」有關於kafka的教學文章, 那麼在開發過程中我們遇到了 👻 詭異事件, 那就是我們嘗試在做一個檔案串流時, 發現Producer明明傳送了大約16MB檔案大小的封包到kafka, 每一包約(1024 * 1024 ) bytes
更快、更短、更即時是串流傳輸必要的元素, 而我們常常在使用Python請求API時都是等待式回應, 也就是一個請求過去之後, 待對方處理完畢後再行回應, 但假設需要下載的檔案、內容非常大時, 是不是使用者只能傻傻的等待整個傳輸結束後才能顯示? 這樣的使用者體驗也實在太糟糕了, 對於使用者來說除了完全
前段時間我們有介紹「【Python 軍火庫🧨 - websockets】雙向溝通的渠道」, 這種方式可以達到基本的連線沒問題,但隨著資安意識的抬頭, 我們的websocket連線也會需要在通道之上進行加密, 那麼我們將根據使用情境來教您如何選用適當的連線。 Server端 我們的Serve
情況描述 我們在「【🔒 Python 先修班】教你親手打包專屬套件庫的手作課(pip install…)」有提到如何打包Python讓自己的程式變成套件, 讓其他人可以用pip install的方式進行安裝,😲 But… 我們實際上打包後, 發現到引用的檔案都有被打包進去,但目錄卻未被打包
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
今天來介紹python的函式 函式在python中是非常重要的一環,因為到了後期,程式會越來越複雜。 而函式可以想成是容易管理的小程式,當我們需要使用時,只需呼叫即可。
Thumbnail
古有四大名著,現今Python四大容器🤣 哪四個?list串列,tuple元組,dict字典,set集合。 那這四個怎麼分? 一起來看看吧! (以下有手寫與上機實際測試請付費觀看) 以上我精心整理主要會使用到的功能 當然python功能太多了,肯定不只。 實際操作: 大概就這樣?(
Thumbnail
維生素是維持身體正常運作所不可或缺的元素,讓我們一同揭密維生素的奧秘。
Thumbnail
在現代醫學中,抗生素扮演著重要的角色,對抗細菌感染、保護我們的身體健康。然而,正確使用抗生素是保護自己和社會免受抗藥性影響的關鍵。一起來了解抗生素的基本知識,從使用時機到副作用,提供您全方位的了解。 💡
Thumbnail
陳先生住在高雄前鎮區瑞祥國小附近🏫 是一名專業的工人, 他在工作場所長時間暴露於高噪音環境下🔇 導致了噪音性聽損, 使得他的聽力逐漸下降, 影響到正常的日常溝通, 為了改善這個問題, 陳先生先前嘗試了一些簡易型助聽器, 但未能滿足他的實際需求。 在杏一藥局的推薦下, 陳先生來
Thumbnail
經濟是國家的命脈,社稷重點無可厚非,國際情勢不好、經濟危機出現時,國家資源救市,穩定法人、投資人信心,維持正常的金融機轉,讓國家度過危機,👍值得嘉許,只是這次國安基金護盤的故事,讓人百般尋味。 台股去年創下18650破紀錄新高,隨著國際局勢一起回檔,國安基金決定進場護盤: 第一:當時股市萬八,不是
Thumbnail
在最近動盪的銀行冒險記裡,開始出現銀行倒閉的新聞,或是接近倒閉被接管,💣一個個炸彈,在主政者的輔助下,細細呵護的灌溉、包紮,給予營養補給,🇺🇸美洲的銀行危機,暫時告一段落。 後來出現了另一個危機,CS瑞士信貸,不是CS絕對武力,Credit Suisse,規模同比有過之而無不及,好像一顆加大的
Thumbnail
第一家公司產品的由專業團隊設計和研發的,因此品質得到保證。提供豐富的資源,包括在線健康諮詢服務和健康資訊,幫助顧客了解如何使用產品和實現健康目標。該公司的產品具有良好的可負擔性。通過線上購買,顧客可以輕鬆訂購所需的產品,並且該公司的價格也相對實惠。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
今天來介紹python的函式 函式在python中是非常重要的一環,因為到了後期,程式會越來越複雜。 而函式可以想成是容易管理的小程式,當我們需要使用時,只需呼叫即可。
Thumbnail
古有四大名著,現今Python四大容器🤣 哪四個?list串列,tuple元組,dict字典,set集合。 那這四個怎麼分? 一起來看看吧! (以下有手寫與上機實際測試請付費觀看) 以上我精心整理主要會使用到的功能 當然python功能太多了,肯定不只。 實際操作: 大概就這樣?(
Thumbnail
維生素是維持身體正常運作所不可或缺的元素,讓我們一同揭密維生素的奧秘。
Thumbnail
在現代醫學中,抗生素扮演著重要的角色,對抗細菌感染、保護我們的身體健康。然而,正確使用抗生素是保護自己和社會免受抗藥性影響的關鍵。一起來了解抗生素的基本知識,從使用時機到副作用,提供您全方位的了解。 💡
Thumbnail
陳先生住在高雄前鎮區瑞祥國小附近🏫 是一名專業的工人, 他在工作場所長時間暴露於高噪音環境下🔇 導致了噪音性聽損, 使得他的聽力逐漸下降, 影響到正常的日常溝通, 為了改善這個問題, 陳先生先前嘗試了一些簡易型助聽器, 但未能滿足他的實際需求。 在杏一藥局的推薦下, 陳先生來
Thumbnail
經濟是國家的命脈,社稷重點無可厚非,國際情勢不好、經濟危機出現時,國家資源救市,穩定法人、投資人信心,維持正常的金融機轉,讓國家度過危機,👍值得嘉許,只是這次國安基金護盤的故事,讓人百般尋味。 台股去年創下18650破紀錄新高,隨著國際局勢一起回檔,國安基金決定進場護盤: 第一:當時股市萬八,不是
Thumbnail
在最近動盪的銀行冒險記裡,開始出現銀行倒閉的新聞,或是接近倒閉被接管,💣一個個炸彈,在主政者的輔助下,細細呵護的灌溉、包紮,給予營養補給,🇺🇸美洲的銀行危機,暫時告一段落。 後來出現了另一個危機,CS瑞士信貸,不是CS絕對武力,Credit Suisse,規模同比有過之而無不及,好像一顆加大的
Thumbnail
第一家公司產品的由專業團隊設計和研發的,因此品質得到保證。提供豐富的資源,包括在線健康諮詢服務和健康資訊,幫助顧客了解如何使用產品和實現健康目標。該公司的產品具有良好的可負擔性。通過線上購買,顧客可以輕鬆訂購所需的產品,並且該公司的價格也相對實惠。