在開始之前, 建議您先閱讀以下篇章, 相信當您開始大量使用Airflow作業時, 難免會需要儲存空間的方案, 像是今天的主角minio就是其中之一, 而我們會建議您先閱讀相關篇章也是有道理的, 因為我們推薦的方法是盡量以容器化為導向來進行Airflow自動化流程的作業, 避免干擾到主機的運作。
這裡我們歸納出幾個關鍵重點, 幫助您在使用minio容器時更加順利。
詳讀文檔非常重要, 但除了詳讀文檔之外, 我們也要能夠融會貫通, 最好的方法就是善用工具, 像是LLM這類的AI工具, 幫助我們快速聯想與知識轉換, 以下是我們透過這類工具來處理疑難雜症的經驗談, 歡迎閱讀:
主要我們會使用 minio/mc 這個Docker Image來進行我們今日的任務, 而關鍵的幾個重點是我們會設法讓entrypoint不進行作業, 而是透過 command 來執行一連串的minio client command。
個人經驗是一開始卡在entrypoint及command這兩個地方, 這是我們未來使用DockerOperator會常常遇到的問題, 因此我們需要去稍微了解一下各個組件的Docker是如何封裝的, 或者文檔中都會指出應該怎麼使用它, 所以這點要非常注意。