模型解釋能力進步的代價

更新於 發佈於 閱讀時間約 1 分鐘
最近工作的關係,一直在學習資料科學。
分享一個今天有被震驚到的觀念:
我們傳統認知上,目標假設100分,好像付出努力或代價就有機會達到100分。
舉例來說,考試滿分是100分,若考出95分的成績。
大概意味著還有5%的知識理解不足、或作答技巧不夠熟練、或心態不好等等。
雖然5分的進步空間不多,要進步所需要付出的努力,會比考了60分要進步困難很多,不過達到滿分的機會真實地擺在眼前。
而機器學習的模型不是這樣。
假設資料統計起來,看起來約有3%的極端值解釋不了。
如果捨去這3%的極端值,解釋能力就可以大幅提升達到90%,要不要做?鐵定是要的。
回到考試分數的舉例,解釋能力90%比喻當作90分,
這個情況也就變成是說『用永遠得不到那剩下的10分作為犧牲,換來的90分分數』。
那你說,想要把3%的極端值考慮進來呢?
很抱歉,而現有的條件,解釋能力可能會下降到70%不到。
想要考慮進來又提高解釋能力的話,那可能需要:
更多的參數(知識),更好的資料整理(融會貫通),更好的心態(作答技巧之類的)等等
但你看不到範圍,有可能窮盡大量時間和成本,只能換到不起眼的進步。
所以追求解釋能力的進步,困難度完全不同於我們以往所謂『進步』的概念。
avatar-img
5會員
19內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
虎斑貓的沙龍 的其他內容
最近看到兩個新聞,都是在講政府統計的空屋率。 內政部台灣公佈空屋戶數約88萬戶,總戶數約890萬戶,空屋率下降到10%以下,近年來新低。 主計處的統計,空屋有166萬戶,攀升的數字突破以往。 166萬-88萬=78萬,中間相差78萬戶究竟跑到哪裡去?到底誰說的是真話?巨大的落差不免引起我的興趣
之前一直認為投資著重的是觀念,認知上觀念正確的話應該就不需要策略,策略大概是屬於那些短近短出的交易者,與他人在零和遊戲當中廝殺需要的方法。 而前陣子在航運股的投資交易學到了教訓,深深體認到投資絕對是需要策略的幫助,只有依靠觀念來執行交易,會缺乏足夠的守成能力。 意識到策略的重要性,今天突然領悟了,
這次哪裡不一樣 人們容易因為未知和恐懼到害怕和焦慮,如果有事情脫離了控制,那麼與其強塞一個理由或原因解釋,其實還有另外一個選擇,回歸到狀況分析與檢討。 首先,自己是不是還是承認總有未知,以及無法理解的事情存在?答案是:是的。 不知道就是不知道,為什麼這樣子,真的不知道。 為什麼過去信誓旦旦
痛苦難以言喻 其實自己也不確定現在是在凹單,還是堅持自己的投資哲學。 未實現損益今天只剩最高時候的50%,這次航運的回檔遠超乎自己的想像,因此已經也不得不思考最糟糕的可能,大約再吃三根跌停,未實現損益會只剩20%,如果再跌......再檢討。 這次成也重倉,敗也重倉。
最近看到兩個新聞,都是在講政府統計的空屋率。 內政部台灣公佈空屋戶數約88萬戶,總戶數約890萬戶,空屋率下降到10%以下,近年來新低。 主計處的統計,空屋有166萬戶,攀升的數字突破以往。 166萬-88萬=78萬,中間相差78萬戶究竟跑到哪裡去?到底誰說的是真話?巨大的落差不免引起我的興趣
之前一直認為投資著重的是觀念,認知上觀念正確的話應該就不需要策略,策略大概是屬於那些短近短出的交易者,與他人在零和遊戲當中廝殺需要的方法。 而前陣子在航運股的投資交易學到了教訓,深深體認到投資絕對是需要策略的幫助,只有依靠觀念來執行交易,會缺乏足夠的守成能力。 意識到策略的重要性,今天突然領悟了,
這次哪裡不一樣 人們容易因為未知和恐懼到害怕和焦慮,如果有事情脫離了控制,那麼與其強塞一個理由或原因解釋,其實還有另外一個選擇,回歸到狀況分析與檢討。 首先,自己是不是還是承認總有未知,以及無法理解的事情存在?答案是:是的。 不知道就是不知道,為什麼這樣子,真的不知道。 為什麼過去信誓旦旦
痛苦難以言喻 其實自己也不確定現在是在凹單,還是堅持自己的投資哲學。 未實現損益今天只剩最高時候的50%,這次航運的回檔遠超乎自己的想像,因此已經也不得不思考最糟糕的可能,大約再吃三根跌停,未實現損益會只剩20%,如果再跌......再檢討。 這次成也重倉,敗也重倉。
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
分類:心理勵志 書名:《深度思考的技術》 作者:楊大輝 個人評分:5/5 ——————— 1、聽過一種說法:99分與100分雖然只差1分,但100分是因為考卷最多就是100分,而99分是因爲實力只夠99。 這本書的含金量相較於上一本閱讀的《文明、現代化、價值投資與中國》遜色許多,但在架構
Thumbnail
本文探討了在生活中進行持續學習的重要性,提供了一個有助於安排學習計畫的框架,並強調了機會成本和比較優勢的概念。學習項目被分為補強、卓越與機會三個分類,讀者可透過這些分類來識別自身及孩子在學習過程中的需求與資源配置。此外,如何利用外部視野和專業協助,提升學習效率和效果,也是文章的重要焦點。
Thumbnail
學習生成式AI,不僅僅是掌握幾個工具,而是從全方位了解AI的發展範疇及其潛力。我經常在企業教授AI課程時,會遇到HR詢問:某些工具用不上,可以不教嗎?當然可以,但如果同仁不了解生成式AI在「數位內容」上的廣泛應用,又如何掌握大語言模型的發展邊界?
我們生活的世界離不開數字。有的時候是非常精準的科學,也有的時候是表達我們的觀點。這些數字對我們的影響力很大,看看我們可以說出來的話有哪些吧
瞭解梯度下降算法中的學習速率調整,包括為什麼需要動態的學習速率、Root Mean Square、RMSProp、最常用的optimization策略Adam,以及如何進行Learning rate Scheduling。
Thumbnail
理由很簡單,就算 AI 和人一樣強大,比如貢獻值是 1,只需要一般人往上面加個 0.1,那麼你的成品就超過了 AI 的作品了⋯ 不懂 AI 的人會過時嗎,會被淘汰嗎? 可以說是又可以說不是⋯ 不懂 AI 的人的薪酬肯定被降低了,不過不等於會消失⋯ 就像很多人也不懂電腦的專業知識,比如連簡單的計
努力的程度與多寡不一定能被量化
Thumbnail
如果想為自己某個表現,或是要幫助別人思考可以進步的地方,你可以說:「如果滿分是 100 分,你為自己這個表現打幾分?」 目的不是知道評分多少,而是你會去思考扣分的原因是什麼,知道原因才能想方法改善,幫助自己也幫助對方思考,但問對方這個問題時,最好確認對方內心是真的想進步。 成長並不是關於得幾
Thumbnail
你讓自己退回到97分,你說:『我想要保留那3分來試煉我自己』你現在知道為什麼這個感情的線是這麼的細了,因為它只值3分啊!但是你要補足那100分,你要花多少的力氣呀!你現在知道為什麼這個感情的線是這麼的細了,因為它只值3分啊!但是你要補足那100分,你要花多少的力氣呀!
做任何事之前都應該了解「機率」 機率越大結果會越接近理想值 那要怎麼提高完成的機率呢 以下跟你分享3點 1.理解自己的能力(內部資源) 我們常說「自信大於能力」 為什麼我們總是會評估錯自己的能力呢 這是因為「沒經驗」 聽起來很簡單的事情 我們總是會忽略 就像是投資 以為看了幾本
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
分類:心理勵志 書名:《深度思考的技術》 作者:楊大輝 個人評分:5/5 ——————— 1、聽過一種說法:99分與100分雖然只差1分,但100分是因為考卷最多就是100分,而99分是因爲實力只夠99。 這本書的含金量相較於上一本閱讀的《文明、現代化、價值投資與中國》遜色許多,但在架構
Thumbnail
本文探討了在生活中進行持續學習的重要性,提供了一個有助於安排學習計畫的框架,並強調了機會成本和比較優勢的概念。學習項目被分為補強、卓越與機會三個分類,讀者可透過這些分類來識別自身及孩子在學習過程中的需求與資源配置。此外,如何利用外部視野和專業協助,提升學習效率和效果,也是文章的重要焦點。
Thumbnail
學習生成式AI,不僅僅是掌握幾個工具,而是從全方位了解AI的發展範疇及其潛力。我經常在企業教授AI課程時,會遇到HR詢問:某些工具用不上,可以不教嗎?當然可以,但如果同仁不了解生成式AI在「數位內容」上的廣泛應用,又如何掌握大語言模型的發展邊界?
我們生活的世界離不開數字。有的時候是非常精準的科學,也有的時候是表達我們的觀點。這些數字對我們的影響力很大,看看我們可以說出來的話有哪些吧
瞭解梯度下降算法中的學習速率調整,包括為什麼需要動態的學習速率、Root Mean Square、RMSProp、最常用的optimization策略Adam,以及如何進行Learning rate Scheduling。
Thumbnail
理由很簡單,就算 AI 和人一樣強大,比如貢獻值是 1,只需要一般人往上面加個 0.1,那麼你的成品就超過了 AI 的作品了⋯ 不懂 AI 的人會過時嗎,會被淘汰嗎? 可以說是又可以說不是⋯ 不懂 AI 的人的薪酬肯定被降低了,不過不等於會消失⋯ 就像很多人也不懂電腦的專業知識,比如連簡單的計
努力的程度與多寡不一定能被量化
Thumbnail
如果想為自己某個表現,或是要幫助別人思考可以進步的地方,你可以說:「如果滿分是 100 分,你為自己這個表現打幾分?」 目的不是知道評分多少,而是你會去思考扣分的原因是什麼,知道原因才能想方法改善,幫助自己也幫助對方思考,但問對方這個問題時,最好確認對方內心是真的想進步。 成長並不是關於得幾
Thumbnail
你讓自己退回到97分,你說:『我想要保留那3分來試煉我自己』你現在知道為什麼這個感情的線是這麼的細了,因為它只值3分啊!但是你要補足那100分,你要花多少的力氣呀!你現在知道為什麼這個感情的線是這麼的細了,因為它只值3分啊!但是你要補足那100分,你要花多少的力氣呀!
做任何事之前都應該了解「機率」 機率越大結果會越接近理想值 那要怎麼提高完成的機率呢 以下跟你分享3點 1.理解自己的能力(內部資源) 我們常說「自信大於能力」 為什麼我們總是會評估錯自己的能力呢 這是因為「沒經驗」 聽起來很簡單的事情 我們總是會忽略 就像是投資 以為看了幾本