RockNiu的沙龍

〈預測未來：用線性回歸做預測〉－一起來當算命師！

發佈於厭世青年只好讀冊

2019/06/22 更新2019/06/11 發佈閱讀 4 分鐘

本文大部分內容出自對《成為python數據分析達人的第一課(自學課程)》當中第六章〈預測未來：用線性回歸做預測〉的閱讀筆記、一些發散的心得與舉例（或是，幹話），閱讀者可酌情參考。

先說個笑話，研究所時某位教授開了門<因果推論>的量化課程，沒想到如此硬派的課程，卻吸引了為數眾多的學生參與，，這些同學的本意竟是想來學算命格、看命盤的，想當然爾，這樣的人潮在第二堂課後便不復見了。

說到透過線性回歸（數據分析）的方式預測未來，首先要做的事情，當然是決定我們要預測什麼事件的未來。畢竟，一個好的算命師傅不能在每次回答信眾問題時，總嚷嚷著「你會發大財」、「夢想會成真」等相對空泛的概念，因此這部分課程也強調了通過個人的專業素養以及對該領域的理解，試圖去問出一個有邏輯的問題 :

X（定義域，輸入資料）----F（函數，某種機制）----Y（值域，結果資料）

只要我們有足夠的原理去證明X資料經由F機制之後得出來的結果Ｙ，是符合邏輯的，我們便可以利用過去的經驗，配合數據分析或機器學習後，得出一個可預測日後類似狀況結果的機制，如果用白話點的例子來看：

raw-image

雖然兩者最終的結果可能都會是零分一致（畢竟是大雄啊...），但後者的問法，透過明顯承先啟後的相關數據進行預測，相對而言是較有邏輯的。當然，這是建立在個人知識背景下的問法，如果把同樣問題拿去問PTT實業坊上的 ffaarr 大大 a.k.a. 哆啦王，他或許便可以拿出一套因應哆啦a夢借出考試道具給大雄的次數，來預測大雄數學成績的模型假設，興許這才是真正能幫助我們「預測未來」的數據吧。

raw-image

概念的部分完備後，便準備進入到下個階段「歷史資料的蒐集」，這裡就不得不提到The 80/20 data science dilemma的概念：

大多數數據科學家只花費20％的時間用於實際數據分析，80％的時間用於查找，清理和重組大量數據。(Armand Ruiz，2017)

這聽起來是件挺悲觀且阿砸(ak-tsak，台語，指心煩意亂)的事情，萬幸的是，這方面還可以透過python裡面的”pandas”套件來幫助我們，更多相關的內容可以參考《用熊貓做基本數據分析》的課程內容，重點在於，我們如何整理出一個適合分析的資料集，像是以下結果：

大雄前五次的數學成績(x)跟該次的數學成績(y)的資料集
x1=(0,15,15,0,30), y1=20
x2=(0,0,0,100,30), y2=0
x3=(0,15,15,0,0), y3=100
　　　　　．
　　　　　．

一旦整理出適合學習的資料態樣後，我們便可以試圖從中找到一個適合的f(x)^（函數）以預測出y（正解）。

raw-image

raw-image

在找出屬於這份資料的那條線後，最後一點，便是「評估是否符合需求」，也就是再次驗證我們所得到的結果是不是「有準」，是否真的有預測未來的效果，這也可以透過對資料進行分組（訓練資料、測試資料）來達到目的。

以上介紹了有關〈預測未來：用線性回歸做預測〉概念性部分的內容，若是搭配後半段資料分析實作的部分，相信~~人人都可以當算命師吧！~~你會對回歸分析、資料分析乃至機器學習，有更進一步的認識。

筆記就寫到這，感謝您的閱讀，希望在這個時代，我們都能透過文字/閱讀，學著好好理解彼此。

RockNiu

#政大磨課師

RockNiu的沙龍厭世青年只好讀冊厭世青年看研究

留言

留言分享你的想法！

RockNiu的沙龍

4會員

11內容數

厭世青年們將近期閱讀細細咀嚼後，透過平易的文字與心得方式呈現。它可能是廢文，也可能讓你從中找到些靈感，而我們希望是後者。

你可能也想看

金麟生命的沙龍

文鳥已經落伍了，未來是AI算命的時代

鐵口直斷一直是許多算命師的金字招牌，但未來幫你算命的可能不再是算命仙、章魚、烏龜或是文鳥。大AI時代的到來也帶出了科技算命的產業革命。未來幫你算命的可能是一套程式，甚至你連自己會活多久都能一窺一二。

#算命#壽命#保險業

2023/12/26

金麟生命的沙龍

文鳥已經落伍了，未來是AI算命的時代

鐵口直斷一直是許多算命師的金字招牌，但未來幫你算命的可能不再是算命仙、章魚、烏龜或是文鳥。大AI時代的到來也帶出了科技算命的產業革命。未來幫你算命的可能是一套程式，甚至你連自己會活多久都能一窺一二。

#算命#壽命#保險業

2023/12/26

小波紫微-次世代紫微斗數命理的沙龍

算命很迷信！？真正算命很科學解釋在這！（上）先想科學是什麼

不久前擺攤時，聽到路人經過我攤位時說出「我只相信科學」的內容，所以發想出來寫這篇文章討論這個主題，首先要先確認的就是什麼是科學?

#科學#算命#算命迷信

2023/12/03

小波紫微-次世代紫微斗數命理的沙龍

算命很迷信！？真正算命很科學解釋在這！（上）先想科學是什麼

不久前擺攤時，聽到路人經過我攤位時說出「我只相信科學」的內容，所以發想出來寫這篇文章討論這個主題，首先要先確認的就是什麼是科學?

#科學#算命#算命迷信

2023/12/03

窮湯姆先生的普通常識

學習三部曲（二）成為專才-實戰篇

理論不付諸實踐就沒意義了。

#自我成長#個人成長#學習

2022/09/02

窮湯姆先生的普通常識

學習三部曲（二）成為專才-實戰篇

理論不付諸實踐就沒意義了。

#自我成長#個人成長#學習

2022/09/02

劉奕酉的職場致勝賽局

【數據思維】培養統計思維，提升面對不確定性的決策品質

你可以不懂統計，但不能不知道統計思維，尤其在這個大數據時代。這能讓你更好地解讀身邊的資訊，運用這些資訊來做出更好的決定與判斷。

#數據思維#統計思維#大數據

2022/06/06

劉奕酉的職場致勝賽局

【數據思維】培養統計思維，提升面對不確定性的決策品質

你可以不懂統計，但不能不知道統計思維，尤其在這個大數據時代。這能讓你更好地解讀身邊的資訊，運用這些資訊來做出更好的決定與判斷。

#數據思維#統計思維#大數據

2022/06/06

海貓貓的沙龍

經驗與預測，Bayesian Inference

貝氏推論(Bayesian Inference)是一種著名的推論方式。貓貓在此稍作介紹。

#投資#貝氏推論#統計推論

2022/04/20

海貓貓的沙龍

經驗與預測，Bayesian Inference

貝氏推論(Bayesian Inference)是一種著名的推論方式。貓貓在此稍作介紹。

#投資#貝氏推論#統計推論

2022/04/20

Dodson的沙龍

創作屬於我的數據分析 Road Map

這篇文章會以提供學習素材以及方法的方式，分享給讀者們，也希望自己可以跟著適合自己步調的學習地圖走得更遠。我也是數據分析初心者，所以需要一本武功秘笈，可惜沒有適合我的絕世武功，那不如我們自創一本！程式語言: Python or R: SQL（資料庫相關）統計分析：統計基礎：

#數據分析#Data#Bigdata

2022/03/30

Dodson的沙龍

創作屬於我的數據分析 Road Map

這篇文章會以提供學習素材以及方法的方式，分享給讀者們，也希望自己可以跟著適合自己步調的學習地圖走得更遠。我也是數據分析初心者，所以需要一本武功秘笈，可惜沒有適合我的絕世武功，那不如我們自創一本！程式語言: Python or R: SQL（資料庫相關）統計分析：統計基礎：

#數據分析#Data#Bigdata

2022/03/30

朔雪寒的沙龍

預測的哲學打算說什麼？

本專題的核心精神還是在於那些可以被閱讀者所理解與掌握的東西，包含推理、邏輯、思考方式、規律、規則等可以被具體描述的智慧。多看幾遍古人怎麼預測的故事，自然也會開拓自己的思路，這是最低要求。最後主要還是想探討究竟人類面對未知與未來，目前有哪些工具與方法可以運用。有哪些思考誤區與坑，應該避免、可以避免。

#預測#占卜#統計學

2022/03/25

朔雪寒的沙龍

預測的哲學打算說什麼？

本專題的核心精神還是在於那些可以被閱讀者所理解與掌握的東西，包含推理、邏輯、思考方式、規律、規則等可以被具體描述的智慧。多看幾遍古人怎麼預測的故事，自然也會開拓自己的思路，這是最低要求。最後主要還是想探討究竟人類面對未知與未來，目前有哪些工具與方法可以運用。有哪些思考誤區與坑，應該避免、可以避免。

#預測#占卜#統計學

2022/03/25

WHorkation 斯丁ت

數據分析｜成為數據分析師的第一堂課，Google 破壞大學學位計畫

不知道大家曾經上過哪些線上平台的課程，VUCA的高變動性時代，過往體制內的科系，遠不足以應付未來世界的工作職能，而Google則根據未來市場急需且「高成長、高收益的工作」，推出3大數位學程，數據分析是一項必備的技能，協助我們找到問題的肇因、運用數據導向的思維、判斷出最佳的決策。

#數據分析#商業分析#GoogleAnalytics

2021/08/01

WHorkation 斯丁ت

數據分析｜成為數據分析師的第一堂課，Google 破壞大學學位計畫

不知道大家曾經上過哪些線上平台的課程，VUCA的高變動性時代，過往體制內的科系，遠不足以應付未來世界的工作職能，而Google則根據未來市場急需且「高成長、高收益的工作」，推出3大數位學程，數據分析是一項必備的技能，協助我們找到問題的肇因、運用數據導向的思維、判斷出最佳的決策。

#數據分析#商業分析#GoogleAnalytics

2021/08/01

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News