1、統計學,Chapter 3 統計量,統計學,2,Chapter 3 統計量,3.1 集中趨勢統計量 3.2 變異性的統計量 3.3 謝比雪夫定理及經驗法則 3.4 相對位置統計量 3.5 Excel應用範例,統計學,3,統計量,參數:從母體量測值的計算所獲得的數值。 統計量:從樣本量測值計算而得的數值。 統計量的計算: 集中趨勢統計量 平均數、中位數及眾數 變異性的統計量 全距、變異數與標準差 謝比雪夫定理及經驗法則 相對位置的統計量 z分數、百分位數及四分位數,統計學,4,3.1 集中趨勢統計量,樣本平均數(x): 一組樣本量測值總和除以個數n。 母體平均數(): 母體量測值的總和除以總量測
2、數N。 中位數(Me): 將一組量測數由小到大排列後,其中央位置的數值。 眾數(m):量測值中發生次數最多的數。,統計學,5,平均數 一組量測值的算術平均值(mean)是最常用的中心位置衡量。算術平均值也稱為平均數。 符號 x 代表樣本平均數。 符號代表母體平均數。 樣本平均數的計算:,統計學,6,中位數 當量測組為奇數時,第(n+1)/2)位置的數值,即為中位數,可寫成Me ;當量測組為偶數時,第(n/2)位置的數值加上(n/2)+1)位置的數值,再取其平均數。 例題3.3 如果資料組因一個或多個極端值而強烈偏移,則以中位數作為中心位置的衡量,優於平均數。,統計學,7,眾數 第三種找出分配中
3、心位置的方法是找出量測值中發生次數最多的數,稱為眾數(mode),可寫成m。 在連續型資料的直方圖中,最高峰那組便是眾數。 眾數可能超過一個,出現雙峰分配。,統計學,8,3.2 變異性的統計量,全距(R):資料組中,最大及最小量測值間的差距。 母體變異數(2):為N個量測值和平均值間的偏差平方和除以N。 樣本變異數(S2):為個量測值和平均值的偏差平方和除以n-1。 母體標準差():為母體變異數的正平方根。 樣本標準差(S):為樣本變異數的正平方根。,統計學,9,離散或變異程度是資料重要的特徵之一。 資料變異的程度代表資料間的差異程度。,統計學,10,全距 全距是最簡單的變異統計量,一組合n/
4、N個量測值的資料組之全距(range),可寫為R。 為最大及最小量測值間的差距。 全距並非是資料組最適當的變異衡量方式,統計學,11,變異數 每一量測值與平均數的距離值。 如果,距離值很大,表示資料的離散比距離值較小者,離平均數較遠。,統計學,12,統計學,13,為了避免距離中負值因加法的關係被抵消,因此,將量測值與平均數的距離取平方,如下:,統計學,14,變異數(variance)分為母體變異數(2)及樣本變異數(S2)。,統計學,15,母體標準差(standard deviation)為母體變異數的正平方根,計算公式為:,統計學,16,樣本變異數定義為n個量測值的集合中,量測值和平均值的偏
5、差平方和除以-1,計算公式為:,統計學,17,樣本標準差亦為樣本變異數的正平方根,計算公式為:,統計學,18,計算樣本變異數時是除以n-1而非除以n 。 當資料離散程度大時,變異數與標準差會相對地大;當資料離散程度小時,變異數與標準差會相對地小。,統計學,19,簡化變異數的計算公式被推導如下:,統計學,20,統計學,21,變異數與標準差有以下幾項特點: s值永遠大於等於0。 s2值或s值愈大,資料之變異性愈大。 若s2或s等於零,則所有量測值均為相同值。,統計學,22,分類資料的平均數與標準差 假設有些資料出現不只一次,且是以次數分配的方式呈現,如下:,k為觀察值分類,統計學,23,其資料組之
6、樣本平均數與變異數之計算公式為:,統計學,24,3.3 謝比雪夫定理及經驗法則,謝比雪夫定理:一組n或N個之量測值的資料組,至少有(1-(1/k2)比率的量測值,會落在距離平均數個標準差以內,此處之大於等於1。 經驗法則:已知量測組近似鐘形分配,其區間在 ()將包含約68%的量測值 (2)將包含約95%的量測值 (3)將包含幾乎100%的量測值,統計學,25,謝比雪夫定理(Tchebysheffs theorem) 不限於量測組分配的型態,也不限於樣本或母體。 證明一組n或N個之量測值的資料組,至少有(1-(1/k2)比率的量測值,會落在距離平均數個標準差以內,此處之k大於等於1。,統計學,2
7、6,標準差與謝比雪夫定理對應的比率,如表3-1所示,兩個及三個標準差的部份,提供了有效的方式來說明量測值落於某特定區間之比率,統計學,27,經驗法則 可以準確地估算近似鐘形分配量測組的分配型態,如圖3-3,資料組的相對次數直方圖愈接近鐘形(bell-sharped)分配,法則愈正確。 鐘形分配通常稱為常態分配。,統計學,28,圖3-3 鐘形分配,經驗法則被定義為已知量測組近似鐘形分配,其區間在 ()或(xs)將包含約68%的量測值。 (2)或(x2s)將包含約95%的量測值。 (3)或(x3s)將包含幾乎100%的量測值。,統計學,29,標準差的檢查 由謝比雪夫定理與經驗法則,大部份的量測值會
8、落在距離平均數兩倍標準差的區間內。 因此,資料組的全距(R),大約等於四倍標準差。,統計學,30,3.4 相對位置統計量,z分數:百分位數:,統計學,31,z分數 某觀察值在一組資料中的相對位置。 此z分數被定義為:,統計學,32,百分位數(percentile) 適用於大量的量測值。 定義為一組已按大小排序之變數x的第n個量測值,其第p百分位數之大小為大於p%的量測值而小於剩下之(100-p)%的量測值。,統計學,33,第25百分位數(下四分位數,Q1),表示超過1/4的量測值,並小於剩下3/4的量測值; 第75百分位數(上四分位數, Q3 ),表示超過3/4的量測值,並小於剩下1/4的量測
9、值。,統計學,34,計算第25及第75百分位數的方式為: 第25百分位數(下四分位數, Q1 ),是位在第0.25(n+1)的位置。 第75百分位數(上四分位數, Q3)是位在第0.75(n+1)的位置。 當0.25(n+1)及0.75(n+1)之值不是整數時,以相對距離權數求四分位數,其值介於兩相鄰資料之間。,統計學,35,3.5 Excel應用範例,本節以例題3.11為例,說明如何以Excel來求算平均數、母體變異數、母體標準差及百分位數。 求平均數 求平均數共分為以下五步驟,說明如下:,統計學,36,步驟一: 進入Excel,並鍵入例題3.11資料,如圖3-4,統計學,37,步驟二:,統
10、計學,38,步驟三:,統計學,39,步驟四:,統計學,40,步驟五:,統計學,41,求母體變異數 求母體變異數之步驟時重覆平均數之步驟一及步驟二後,尚有以下三步驟,說明如下:,統計學,42,步驟一:,統計學,43,步驟二:,統計學,44,步驟三:,統計學,45,求母體標準差 計算母體標準差之步驟與變異數之步驟大致相同,除步驟三出現插入函數之視窗,於選取函數中選取STDEVP(母體標準差)不同外,其餘均相同,因此,經Excel計算,亦求得母體標準差2.6224。,統計學,46,求百分位數 求百分位數之步驟時重覆平均數之步驟一及步驟二後,尚有以下三步驟,說明如下:,統計學,47,步驟一: 選擇後出現插入函數之視窗,於選取類別中選取統計及選取函數中選取PERCENTILE(百分位數),按下確定鍵。 步驟二: 選擇後出現函數引數之視窗,於Array欄位中,以滑鼠選取資料範圍後出現資料範圍A1:E5,再於K欄位中輸入0.5(第五十百分位數),按下確定鍵,如圖3-12,統計學,48,步驟三: 將於空欄位中出現第五十百分位數21.6。,