1、第十三章簡單線性迴歸分析-4,Simple Linear Regression -4,學習目標,複習 - 2. 今日內容 -,簡單線性迴歸分析- 1 、 2 、 3 簡單線性迴歸分析- 4,學習目標 (複習重點內容),簡單線性迴歸分析- 1 1. 簡單線性迴歸模型 - 迴歸模型參數之估計模型各變異量的估計 - ANOVA 表,簡單線性迴歸分析- 23. 估計誤差項的變異情形4. 決定係數的計算與解釋 - R2 (或是 r2 ),學習目標 (複習重點內容),簡單線性迴歸分析- 3評估衡量所建立的模型 - 驗證迴歸模型成立的假設 迴歸斜率係數的檢定 - 決定因變數Y與自變數X間是否有線性相關,學習
2、目標 (今日內容 ),7. 利用迴歸模式做估計或預測工作8. 線性相關分析9. 回顧簡單線性迴歸分析所學,簡單線性迴歸分析- 4,迴歸模型使用時的步驟Regression Modeling Steps,1.事先決定反應變數與獨立變數間的模式2.估計模式的參數模式中誤差項的機率分配之描述評估衡量所建立的迴歸模型,F,5. 利用迴歸模式做估計或預測工作在特定x值時,Y的期望平均 E(Yi|xi)在某特定點xi下,Yi的反應6. 線性相關分析,利用迴歸模式做估計或預測工作,(1) 複習 - 簡單線性迴歸模型(2) 了解 - 估計或預測些什麼?,Y,X,i,i,i,=,+,+,b,b,e,0,1,簡單
3、線性迴歸模型,獨立變數和反應變數之間為線性關係,因變數(Dependent response variable),自變數(Independent , explanatory variable),斜率參數slope,截距參數 Y-intercept,隨機誤差Random error,簡單迴歸模型下的母體與樣本,假設母體關係:未知為參數,母體Population,隨機取樣Random Sample,J $,J $,L $,J $,K $,J $,K $,推論,觀察值,簡單線性迴歸模型取樣後結果,觀察值,未取到的觀察值,ei = 殘差觀察到的誤差,1,X,2,X,隨機誤差機率分配示意圖Error P
4、robability Distribution,Y,f(e),X,不同值所對應的Y值均呈現常態分配,而且有相同的變異數,殘差,迴歸直線,使用迴歸模型作預測Prediction With Regression Models,1.在特 定x值時,預測的種類點估計平均Y值區間估計平均Y值、個別y值,估計或預測些什麼? 在特定xp值時,Y的期望平均 =E(Yp|xp) 即在母體迴歸線上的某特定點xp下,Yp的平均反應,預測的示意圖What Is Predicted,|,E(Yp|Xp) 的信賴區間Confidence Interval Estimate of Mean Yp,影響信賴區間寬度的因素Fa
5、ctors Affecting Interval Width,1.信賴水準的選擇Level of confidence (1 - a)信賴水準增加則信賴區間寬度也隨之變寬2.資料距離迴歸線的散布情形 (S)S加大,信賴區間寬度也隨之增加3.樣本數Sample size樣本數減少則信賴區間寬度會隨之增加4.特定點Xp至自變數平均數 X的距離距離越遠則信賴區間寬度將隨之增加,信賴區間估計範例Confidence Interval Estimate,你是銘傳熊寶寶的行銷分析人員, 已知 = -.1, = .7 而 s = .60553。廣告費(千元)銷售量 (千個)1121324254廣告花費在4千
6、元時平均銷售量的95%信賴區間為多少,迴歸模型計算用總結表,直線樣本迴歸估計式,在 = 4 時, 的 點估計值,信賴區間估計求解Confidence Interval Estimate,X to be predicted,在 = 4 時, 的信賴區間,個別特定點估計的預測區間Prediction Interval of Individual Response,注意!多出了1,為何會多出一倍的 S?,|,預測區間估計求解,X to be predicted,在 = 4 時, 的信賴區間,電腦報表之估計,Dep Var Pred Std Err Low95% Upp95% Low95% Upp95
7、%Obs SALES Value Predict Mean Mean Predict Predict 1 1.000 0.600 0.469 -0.892 2.092 -1.837 3.037 2 1.000 1.300 0.332 0.244 2.355 -0.897 3.497 3 2.000 2.000 0.271 1.138 2.861 -0.111 4.111 4 2.000 2.700 0.332 1.644 3.755 0.502 4.897 5 4.000 3.400 0.469 1.907 4.892 0.962 5.837,在x=4時E(y)的點估計值, y,信賴區間,SY
8、,預測區間,在x=4時觀測值, y,全域信賴區間估計形成之信賴帶Hyperbolic Interval Bands,相關(線性)模型Correlation Models,1.衡量兩變數之間線性相關的強度2.線性相關係數(coefficient of correlation)母體(真正)相關係數為 (rho)其值介於-1 至 +1間3.用於了解兩變數之間的線性相關之強度及方向,樣本線性相關係數Sample Coefficient of Correlation,量測兩數值變數間線性相關的程度Measures the strength of the linear relationship betwe
9、en two quantitative variables,雙數值變數的散佈圖形表達正相關例題一,線性相關係數r的計算一,雙數值變數的散佈圖形表達 負相關例題二,線性相關係數r的計算二,線性相關係數的性質Features of Correlation Coefficient,無單位值在-1與1之間越靠近-1時表示負線性相關越強烈越靠近1時表示正線性相關越強烈數值靠近0時表示線性相關微弱,各種線性相關所繪得的散佈圖,r = -1,r = -.6,r = 0,r = .6,r = 1,皮耳森線性相關係數 r (Pearsons coefficient of correlation),樣本形成的線性
10、相關係數Sample Coefficient of Correlation,線性相關係數值的含意Coefficient of Correlation Values,-1.0,+1.0,0,循此方向逐漸加強兩者間的負線性相關關係Increasing degree of negative correlation,-.5,+.5,無線性相關No Correlation,線性相關係數值的含意Coefficient of Correlation Values,-1.0,+1.0,0,-.5,+.5,無線性相關No Correlation,循此方向逐漸加強兩者間的正線性相關關係Increasing deg
11、ree of positive correlation,完全負相關,線性相關係數值的含意Coefficient of Correlation Values,-1.0,+1.0,0,-.5,+.5,完全負相關,無線性相關No Correlation,完全正相關,線性相關係數值各範例Coefficient of Correlation Examples,r = 1,r = -1,r = .89,r = 0,線性相關係數的檢定Test of Coefficient of Correlation,1.可顯示(檢定)出兩變數間關係是否為線性相關2.檢定結果完全相同於迴歸模型斜率b1的檢定結果3.檢定用的
12、假設Hypotheses H0: r = 0 (無線性相關no correlation) Ha: r0 (有線性相關correlation),線性相關的檢定Test for a Linear Relationship,Hypotheses H0: = 0 (no correlation) H1: 0 (correlation)檢定統計量 (Test statistic),熊寶寶行銷範例 1/3,你是銘傳熊寶寶的行銷分析人員,已知b0 = -0.1和 b1 = 0.7.決定係數R2= 0.8167,熊寶寶行銷範例 - 2/3,0,3.1824,-3.1824,.025,Reject,Reject
13、,.025,Critical Value(s):,結論 : 廣告與銷售量之間有著相關性,決策: 拒絕 H0,這個 t 統計量的值 與斜率係數的檢定統計量值是相等的,H0: = 0 (no correlation) H1: 0 (correlation),熊寶寶行銷範例 -3/3 斜率係數檢定,1. H0: b1 = 02. H1: b1 03. a = .05 df = 5 - 2 = 34. Critical Value(s):,5. 在Ho的Test Statistic: 6. Decision:,在 a = .05拒絕0,結論:兩者之間存在著顯著的線性相關,線性相關的檢定例 1/3,Da
14、ta for Seven Stores:,:店面大小是否會 影響年銷售量?,Annual Store Square Sales Feet($000) 1 1,726 3,681 2 1,542 3,395 3 2,816 6,653 4 5,555 9,543 5 1,292 3,318 6 2,208 5,563 7 1,313 3,760,From Excel Printout,線性相關的檢定例 2/3,0,2.5706,-2.5706,.025,Reject,Reject,.025,Critical Value(s):,Conclusion:,H0: = 0 (No associatio
15、n) vs H1: 0 (Association) .05 df 7 - 2 = 5,拒絕 H0,店面大小會影響銷售量,這個 t 統計量的值 與斜率係數的檢定統計量值是相等的,線性相關的檢定例 3/3,H0: 1 = 0H1: 1 0 .05df 7 - 2 = 5Critical Value(s):,Test Statistic: Decision:Conclusion:,店面大小會影響銷售量,t,0,2.5706,-2.5706,.025,Reject,Reject,.025,From Excel Printout,拒絕 H0,回顧所學:迴歸模型使用時的步驟,1.事先決定反應變數與獨立變數
16、間的模式2.估計模式的參數模式中誤差項的機率分配之描述評估衡量所建立的迴歸模型5. 利用模式做估計或預測工作6. 線性相關分析,回顧所學 - 例子,房價(y)和坪數(x)例子1. 建立迴歸模式包括平均價格和誤差部分2. 房價跳動部分,在不同坪數時皆相同(變異數相同)3. 估計迴歸模式及評估房價和坪數之關係知道房屋坪數,只能估計平均房價個別特定房屋之房價,僅以預測區間估計,結論(一),線性迴歸模型及假設條件的描述假設(1). 常態 每一個值所相對應的Y值,通常有許多值,這些值之間呈現的為常態分配誤差項ei 的機率分配為常態假設(2). 變異數為固定常數誤差項的變異數為固定常數,通常命名為s2 假
17、設(3). 誤差項之間相互獨立,結論(二),2. 迴歸模型內各參數的估計(最小平方法),迴歸直線預估方程式,結論(二)變異數分析ANOVA表,3. 變異數分析表(ANOVA Table),結論(三),3. 變異數分析表(ANOVA Table)SST = SSR + SSE df: n-1 = (1) + (n-p-1)MSR = SSR/(1) ; MSE=SSE/(n-p-1)檢定Ho: =0 vs Ha: 0檢定統計量, F*=(MSReg/MSE) F(1; n-p-1),結論(四),4. 線性迴歸模型之詮釋與應用5. 殘差分析(residual analysis) - 評估是否合乎線性迴歸成立的假設檢驗線性結構 殘差圖 ( e vs X)驗證齊一性 -變異數是否一致 Studentized殘差圖 ( SR vs X)檢驗誤差項之間的獨立性 Durbin-Watson檢定,結論(五),6. 迴歸斜率係數的檢定 以樣本斜率的抽樣分配為理論基礎7. 反應變數(平均值, E(Yp|xp)的信賴區間,結論(六),8. 單個觀測值, Yp, 的預測區間,結論(七),9. 決定係數 R2 =SSR/SSE10. 線性相關係數11. 電腦報表的解讀,關於本課程.,1.你此堂課學到的最重要的觀念為何?2.是否還有相關問題與疑問?3.如何改善今後的學習?,請你靜下來想一想並回答下列問題:,