今天在處理完一個分析需求後,被老闆稱讚很會使用 BI tool 😝
雖然這個稱讚直觀看起來並不是直接針對我身為 DA 的專業能力,但其實如果以 數據分析師 Data Analyst 需要的四種能力 提到的 DA 衡量指標:「inspiration-per-minute」來看,老闆的稱讚其實也是針對我身為 DA 的價值,因此我還是蠻開心的
---
介紹一下我們公司使用的 BI tool Mode,在台灣比較少人用,我目前沒聽到有其他台灣公司也在使用這個工具
這個工具很貴,非常貴,但有一個很棒的功能是它可以在做圖表的時候做 aggregation,這個功能大大的提升了 DA 產數據、做分析的彈性
舉例來說:
如果你想分析每個新註冊用戶是透過什麼裝置進行註冊的,以往在其他工具中(e.g. redash),你需要在 query 裡面就先 group by 好 device_type,這樣才可以得到 by device_type 的數據
如果在另一張表上,需要多看一個維度(e.g. 月份),或是換一個維度,你就必須要把 query 複製一份以後,新增或是換掉 group by key,這樣會讓 dashboard 上面充斥著很多都只差一點點的 queries
在 Mode 上你不需要這樣做,你只要把所有註冊用戶列出來,再把你可能用得到的 features 做成 columns,不需要在 query 裡面預先做好 group by,而是等到作圖時,再把你想要的 group by key 丟到 x 軸,這樣 Mode 會自己幫你 group by 好
概念上就很像我們 excel 在做樞紐分析表一樣,你只需要產出數據大表,後續的運算都是在樞紐分析表上設定
因為有了這個功能,所以 DA 可以省下很多改寫 group by key 的時間,同一份 query 可以做出超多種不同類型的圖表,更棒的是,因為這些圖表背後都共用同一份 query,所以如果某天想改一個計算的邏輯(e.g. 篩選資料區間),你改一份 query,會同時套用到所有相關的圖表上,在維護上的成本也小非常多
上述這些便利都是 DA 切身感受到的,而對老闆來說,直接感受到的好處是:
和 DA 在會議中看數據時,可以很快地看到不同維度的數據進行下一步討論
和老闆在會議中看數據時,他蠻常會想到一些事前沒考慮到想多看的新維度,這些新維度的數據在以前必須要等到會議結束後,DA 改完 queries 才能看到
但改用 Mode 之後,只要我事前有準備好這些 columns,在會議當下我只要在介面上拉一拉,就可以很快看到他要的數據,進而做更深入的討論
也因為這個功能真的太便利,加速了我們看數據的流程,所以即便 Mode 真的很貴,我們公司都還是無法離開它
不過,雖然到圖表時才做 aggregation 的功能很方便,但實際應用上還是有所局限:
在資料量過大時會因為運算量過大而失敗
為了要讓 Mode 圖表可以即時做 aggregation,我們必須要把所有原始資料留下來,這有時候會讓 query result 的筆數過大,讓 Mode 在做 aggregation 時,產生過大的運算量而導致失敗
這段目前無解,不過因為公司是 B2B,clients 數量目前還不多,所以比較少遇到資料量過大的問題
---
你們公司是選擇哪一個 BI tool 呢?
歡迎在留言區跟我分享你們公司使用的 BI tool 以及你認為的優點在哪 🙌🏼