今年的國泰金控技術年會,關於 AI 有幾個主題覺得很有趣、也受到一些啟發:
1. 可解釋 AI : AI 的可解釋性一直是一個很被關注的題目,尤其是發生在模型要準備落地應用,需要驗證黑盒子是不是依照正確的邏輯、人類的邏輯去判斷問題,我自己很喜歡這個部分,算法是用一套最基本的SHAP,SHAP基於博弈論的Shapley值,該方法解釋了每個特徵對預測的影響,他很簡單也是最容易被理解的算法。
2. 聯邦學習: 其實在三五年前火紅過,也存在在各種領域例如邊緣計算、醫療保健,將這套應用在金融上、而且用在各子公司,我覺得這個想法非常有亮點,這能解決跨子公司資料不能共享的問題,又能實際實現資料共享的價值。
3.合成資料: 我最喜歡這個部分,也是因為最近的常常遇到這類型的問題。(我覺得每個資料科學家都可能遇到這個難題XD 推薦收藏一下、以被不時之需)
資料往往是建立模型的基本,資料不好、樣本太少,往往模型成效就不好,所以可以透過合成的方式,彌補資料的不足,有一些算法可以來實現,像是 CTGAN,CopulaGAN都能夠生成更多的資料來訓練模型,另一個部分是,國泰提出一個合成工廠的框架,也就是說資料合成後,要一套機制去驗證合成的資料是否品質是好的,舉例來說:合成資料與實際資料的相似程度有多少,如果高度相似是不是也不能使用,我覺得這個概念對我來說是一個很好的啟發。
你覺得年會的哪個部分最有趣呢?