高一下, 統計2

更新於 發佈於 閱讀時間約 3 分鐘
在統計1中, 我們討論了如何觀察一個數值的集合, 擁有諸如「眾數」, 「中位數」, 「算術平均數」和標準差等工具. 那麼, 如果我們想要觀察和瞭解2個數值集合之間的關係呢?
先來討論一個觀念:「標準化」
在我們試著做「比較」時, 往往需要訂立一個比較的「標準」, 這就是標準化的由來. 而標準化往往透過的手段是「除法」.
舉個例子, 今天有個美國人A和一個台灣人B想要比較看看誰比較優秀. 而他們想到的比較方式是各自的年薪.這時候, 由於美國和台灣的薪資水平顯然有著巨大的差異, 一個美國普通人的收入, 往往就輾壓了大部份台灣人(包含台灣菁英)的收入. 直接比較他們各自的年薪然後說這個美國人比台灣人優秀顯然是不合適的. 所以我們可以拿「美國人A的年薪/美國人的平均國民所得」和「台灣人B的年薪/台灣人的平均所得」來比較, 也就是以他們各自所在群體的「算術平均數」當作標準, 透過這樣的「標準化」, 若最後得出「美國人A的年薪/美國人的平均國民所得」=1.5, 而「台灣人B的年薪/台灣人的平均所得」=2, 那麼我們就可以說在這樣的定義上, 這位台灣人B很可能比這位美國人A優秀.
這樣的推論是有前提的, 前提是認為「一般來說, 美國人和台灣人都是人類, 大約是一般聰明和優秀的, 美國人的頂級菁英和台灣人的頂級菁英一樣優秀, 美國人最弱勢的人群也和台灣最弱勢的人群素質接近」, 這樣一來, 透過各自國家的年均所得來當作標準, 所得到的標準化的結果, 會發現那位美國人A的優秀程度大約是1.5個美國人的平均, 而那位台灣人B則是大約2倍於台灣的一般人. 因此判定這位台灣人相對優秀一些.
那麼, 如果我們知道兩個數值集合的「算術平均數」和「標準差」, 能不能定義一種標準化的方式, 讓我們能更客觀的比較這兩個數值集合, 甚至得知這兩個數值集合的(線性)變化關聯性呢?
以標準差為單位的標準化:
前一篇統計1中有提到一個觀念, 其實標準差可以視為一個數值集合中的所有元素到其算術平均數之間的平均距離.
以標準差為底的標準化
證明標準化後平均值為0, 標準差為1
相關係數
相關係數r的定義
數據標準化後相關係數不變
這樣定義相關係數的好處是甚麼?可以幫助我們藉此提取出甚麼客觀資訊?
  1. 相關係數r的範圍有界, 必然介於-1和1之間
證明1「相關係數r必然介於-1和1之間」
證明2「相關係數r必然介於-1和1之間」
2. 當 r 為 1 時,表示兩個變數之間有完全正向線性相關;當 r 為 -1 時,表示兩個變數之間有完全負向線性相關;當 r 為 0 時,表示兩個變數之間沒有線性相關關係。
.相關係數r能表達出相關性的方向,當兩個變數為「正相關」時,此相關係數的數值為正,反之則為負。
.相關係數r能表達出兩變數線性相關的程度。當x變量變大時,y變量有變大或變小的趨勢較強時,兩變量的相關強度較強,此時,相關係數的絕對值也較大。
需要注意的是,當兩個變量的相關係數越接近0,並不一定意味著它們之間沒有任何關係。它們可能存在其他類型的關係,例如非線性關係或時間延遲關係等,這些關係可能需要使用其他方法來進行建模和分析。相關係數只能反映線性相關程度,而不能反映變量之間的其他類型的關係。因此,在分析和建模中,需要根據具體情況選擇適當的方法和技術。
3. 相關係數r與一變數所使用的量測單位無關✩
例如測量身高與體重的相關性時,不論身高的單位是用公分或吋,體重的單位是用公斤或磅,所得的相關係數應相同。
標準化的結果並不因線性關係而變化
4. 標準化資料Y對X的最佳(迴歸)直線L為Y=rX
y對x的最佳直線公式
avatar-img
0會員
7內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
小民的沙龍 的其他內容
複利的計算過程
高一下數列的代入求解法和一般項求解法
一元二次方程式配方法推導過程
「什麼時候才能用數學歸納法?」 數學歸納法的哲學意義是,當1代入時關係成立,且n成立時發現n+1時成立,那豈不是1成立2就成立,接著3也成立,因此到∞也成立? 所有數學歸納法適用的時機是: 1. 該命題要證明的範圍在自然數系中 2. 能透過「被歸納的訊息」找到「n和n+1 or n和n-1的關係」
要觀察一個數值的集合有很多方法,透過這些方法得出數值集合的某些特徵,可以讓我們除了「感覺」外,能有更「理性客觀」的方式來理解這個數值集合的特徵。 眾數:一個集合中出現最多次的那個元素,以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是,以眾數作為一個集合的標籤,我們無法透過眾數得知
複利的計算過程
高一下數列的代入求解法和一般項求解法
一元二次方程式配方法推導過程
「什麼時候才能用數學歸納法?」 數學歸納法的哲學意義是,當1代入時關係成立,且n成立時發現n+1時成立,那豈不是1成立2就成立,接著3也成立,因此到∞也成立? 所有數學歸納法適用的時機是: 1. 該命題要證明的範圍在自然數系中 2. 能透過「被歸納的訊息」找到「n和n+1 or n和n-1的關係」
要觀察一個數值的集合有很多方法,透過這些方法得出數值集合的某些特徵,可以讓我們除了「感覺」外,能有更「理性客觀」的方式來理解這個數值集合的特徵。 眾數:一個集合中出現最多次的那個元素,以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是,以眾數作為一個集合的標籤,我們無法透過眾數得知
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
  今天來閒聊一下標準這件事。由於這裡畢竟是個以小說為主的網站,因此本篇就聚焦在寫作與閱讀這兩方面來討論。   「標準」這個東西其實是最不標準的了,每個人都有自己的標準,會受到喜好、興趣、環境等等的影響而有所不同,而且別說人與人之間,就連同一個人,在不同的時間或人生階段,對同一件事都可能會有不同的
比較的意義是什麼?這世界有人,就存在比較這件事。為了社會的遊戲規則而比較,或為了尋找自己的定位而比較,人們各司其職,不同的人有不同的專長與性格適合不同的位置,而這所謂的「不同」就是比較出來的。比較沒有不好,世人看待比較的心態負面了才會產生不好的行為和影響。
其實這個標題跳了好幾步。 應該說,當全球化趨勢使得教育商品化,為了提供選擇依據,標準化測驗應運而旺,如國際的PISA、國內三至八年級的學力檢測。 然而,標準化測驗有何意義呢? 自1960S幾乎所有研究都顯示,教育成果最主要的影響因素是家庭環境。城鄉差距是難以/不可跨越的鴻溝。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
在人際關係和個人評價上存在雙重標準可能表現在多個方面: 行為評價: 對於相同的行為,可能對不同的人給予不同的評價。例如,對於一個朋友的拖延可能給予寬容,但對另一個人同樣的行為可能會感到不滿。 標準和期望: 對於同樣的成就或表現,可能對不同的人有不同的期望。這可能是基於個人情感或關係的考量。 對
Thumbnail
所以,認清公平與信任法則,跟開放市場拚經濟,這跟架構的關聯是什麼? 筆者要說的是,我們是否有一些前提,對國民就業有想像,還是一切交給市場就好?如果這個世界徹底公平,每個國家互通有無,好比說台灣勞工今天要去日本工作,可以買張機票就過去,到美國蓋廠房也是隨叫隨到,具有高度的移動能力,那的確是一點錯都沒。
先完整計算後面對:平均工作1小時,多少錢? 工作1年,多少錢? 在學術上有個著名的“大麥克指數”: 你的1小時薪水,能夠買幾份大麥克餐? 可能可以用以衡量當地的飲食生活壓力。 如同“房價所得比”,衡量買房需要幾年的薪資。 在不牽扯其他因素下,衡量生活的壓力。先知道問題,才能面對進
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
  今天來閒聊一下標準這件事。由於這裡畢竟是個以小說為主的網站,因此本篇就聚焦在寫作與閱讀這兩方面來討論。   「標準」這個東西其實是最不標準的了,每個人都有自己的標準,會受到喜好、興趣、環境等等的影響而有所不同,而且別說人與人之間,就連同一個人,在不同的時間或人生階段,對同一件事都可能會有不同的
比較的意義是什麼?這世界有人,就存在比較這件事。為了社會的遊戲規則而比較,或為了尋找自己的定位而比較,人們各司其職,不同的人有不同的專長與性格適合不同的位置,而這所謂的「不同」就是比較出來的。比較沒有不好,世人看待比較的心態負面了才會產生不好的行為和影響。
其實這個標題跳了好幾步。 應該說,當全球化趨勢使得教育商品化,為了提供選擇依據,標準化測驗應運而旺,如國際的PISA、國內三至八年級的學力檢測。 然而,標準化測驗有何意義呢? 自1960S幾乎所有研究都顯示,教育成果最主要的影響因素是家庭環境。城鄉差距是難以/不可跨越的鴻溝。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
 當開啟試算表(EXCEL等)的累加(SUM)及離散度,標準差(STDEV)的運算功能後,逐一統計的累進報票式選票統計表就可以退休了,而且全國一萬七千多所的數據不待一所所列出,就可以用較小選區(例如嘉義市198所,宜蘭縣431所等)的統計過程證明統計結果都是正確的,尤其是將計算式列出(隱藏前面的
Thumbnail
在人際關係和個人評價上存在雙重標準可能表現在多個方面: 行為評價: 對於相同的行為,可能對不同的人給予不同的評價。例如,對於一個朋友的拖延可能給予寬容,但對另一個人同樣的行為可能會感到不滿。 標準和期望: 對於同樣的成就或表現,可能對不同的人有不同的期望。這可能是基於個人情感或關係的考量。 對
Thumbnail
所以,認清公平與信任法則,跟開放市場拚經濟,這跟架構的關聯是什麼? 筆者要說的是,我們是否有一些前提,對國民就業有想像,還是一切交給市場就好?如果這個世界徹底公平,每個國家互通有無,好比說台灣勞工今天要去日本工作,可以買張機票就過去,到美國蓋廠房也是隨叫隨到,具有高度的移動能力,那的確是一點錯都沒。
先完整計算後面對:平均工作1小時,多少錢? 工作1年,多少錢? 在學術上有個著名的“大麥克指數”: 你的1小時薪水,能夠買幾份大麥克餐? 可能可以用以衡量當地的飲食生活壓力。 如同“房價所得比”,衡量買房需要幾年的薪資。 在不牽扯其他因素下,衡量生活的壓力。先知道問題,才能面對進