共變數
當兩個變項之間非獨立時,叉積(cross product)並非等於0,且相同趨勢資料個數越多叉積越大,因此我們取平均讓其更能夠代表兩變項關聯的強弱,我們稱之為共變數(covariance)。
共變數無固定範圍,難以判斷兩個變相間的關係強度,所以將共變數標準化—皮爾森積差相關係數(Pearson Product-Moment Correlation Coefficient,r)。

相關係數假設考驗:r^→ρ
已知去年期中考成績與期末考成績相關係數為r^=0.63、N=62,請問心統期中考與期末考成績有關連嗎?

簡單迴歸
迴歸比相關多了預測用途,我們用最小平方法取得的直線稱為迴歸線、最佳適配線。迴歸具有方向性,不可隨意調換,預測出的值也不一定會是正確的Y值,這之間的落差我們稱之為預測誤差、殘差(residual)。

備註:變項做線性轉換不影響r,但會影響迴歸線的表示(除了標準化迴歸以外)。
預測是否準確
我們在班上隨機抽一人猜測他的體重,在沒有任何線索下,我們會先預測是平均值(SSY 總變異)。若在有線索得情況下(例如:身高),我們就能夠做較準確的評估(SSReg 解釋變異)。但預估與實際值仍有誤差(SSRes 殘差變異)。
SSY=SSRes+SSReg,Σ(Y-Y-)2=Σ(Y-Y^)2+Σ(Y^-Y-)2
決定係數 coefficient of determination
總變異可被解釋的比例,越高則此迴歸預測越準確。
SSReg/SSY = r2
標準誤 Sy.x
當r2越大代表可解釋的比例越多,Sy.x越低

線性迴歸假設
直線性
兩變項的關係是直線的,可藉由散步圖看出

變異數同質性
每個預測值上實際值的散佈情形,x軸為預測值,y軸為殘差值。我們期盼看到一個長方形的圖案(代表散佈相似)

常態性
看殘差直方圖
