1、Correlation Chart,Correlation analysis,目 錄,什么是散布圖散布圖的作圖方法散布圖的判斷分析散布圖法在應用中應注意的事項回歸分析回歸方程回歸方程例題r 檢驗的臨界值,1、什么是散布圖,1.1 定義:散布圖也叫相關圖。它是用來研究兩個變量之間相關關系的圖。1.1.1 問題:兩個變量之間是否有互相聯系、互相影響的關系?這种關系是什么樣的關系?1.1.2 事例某些食品的水分与霉變釀酒中酒藥量与出酒率熱處理工藝中淬火溫度与淬火硬度1.1.3 通過對兩個變量進行分析后,可以得出有無關系、什么樣的關系, 以及二者之間所存在的相互讓關系的規律的結論,1.2 兩种不同的關
2、系,1.2.1 确定性的函數關系。這种關系是兩個變量之間存在著完全确定的函數關系例如:圓的周長C 和圓的直徑D之間存在著 C=pD的關系,只要知道圓的直徑,就能精确地求出圓的周長;或者知道圓的周長,就可求得圓的直徑1.2.2 非确定性的相關關系。這种關系是非确定性的依賴或制約的關系。例如:儿童的年齡和体重之間雖有一定關系,但只能一般地說儿童年齡越大,体重也越重。儿童体重(Y)=年齡(X)*2+7(千克),散布圖的作圖方法,重复點在原點上加圈,散布圖的判斷分析,散布圖法在應用中應注意的事項,應將不同性質的數据分層作圖,否則將會導致不真實的判斷結論散布圖相關性規律的适用范圍一般局限于觀測值數据的范
3、圍內,不能任意擴大相關判斷范圍散布圖中出現的個別偏离分布趨勢的异常點,應在查明原因后,予以剔除,回歸分析,研究一個隨机變量与一個(或几個)可控變量之間的相關關系的統計方法稱為回歸分析,只有一個自變量的回歸分析叫做一元回歸分析,多于一個自變量的回歸分析叫做多元回歸分析提供建立有相關關系的變量之間的數學關系式(經驗公式)的一般方法判別所建立的經驗公式是否有效,并從影響隨机變量的諸變量中判別哪些變量是顯著的,哪些是不顯著的;利用所找到的數學表達式尋變量進行預測或控制 儿童体重(Y)=年齡(X)*2+7(千克)例如預測5歲儿童未來体重 17(千克)=5*2+7(千克),可控變量有時稱為自變量不可控變量
4、稱為因變量,回歸方程,回歸方程式:ybar=b0+b1 xybar 稱為回歸值b0,b1 稱為回歸參數,它們需要根据樣本數据進行估計。x 是可以控制或可以精确測量的變量。如年齡、試驗時的溫度、施加的壓力、電壓及時間等y 具有不确定性,但又具有規律性。如人的身高和体重用線性函數b0,+b1x估計y的均值,稱為一元線性回歸r 相關系數。它用來描述兩個變量間線性關系密切程度的一個數量指標,回歸方程公式,一元回歸分析的計算1,一元回歸分析的計算2,相關系數r 的計算,相關系數r的公式与計算一般情況下,rxy簡記為r0,x与y 為完全線性相關x与y 完全線性無關則認為回歸效果顯著則認為回歸效果不顯著,驗
5、算,r 檢驗的臨界值,例:在上例中,求得:r=0.991,根据 n=10, 取 a=0.05, 查得 r0.05=0.632,取 a=0.01, 查得 r0.01=0.765;故 r r0.05,所以回歸效果顯著;且r r0.01,此時,稱回歸效果高度顯著,綜上所述,r 越小,回歸的效果越差,x与y間的線性相關性就越不顯著;而 r 越大,回歸效果越好,x与y間的線性相關性就越顯著。因此,對r進行檢驗可以判斷x与間的線性相關關系是否顯著。,產量關于溫度相關分析結論,左圖表明產量關于溫度的相關為強正相關。回歸方程為ybar=0.223x+9.1212。即產量增加,相應溫度應隨之增加。 查相關系數表:當樣本n=10,檢驗水平 a=0.01時,ra =0.765 產量關于溫度的相關系數r0=0.9910ra =0.765故產量關于溫度的回歸效果高度顯著,