1、基礎統計概念,6 Sigma企劃部3/13/2001,機率的世界 V.S. 確定的世界,百分之百確定的事? 例子.量子的世界機率決定一切統計學家從不說100確定。那麼有多確定? 95%確定;99%確定; 99.99966%確定?,機率 V.S. 統計,母體(分配),樣本(抽樣),機率,統計,Q1:隨機變數X為常態分配N(,2),請問 的平均數、變異數、變異係數?Q2:自某一母體Y隨機抽樣50個樣本,得到樣本平均數為50,樣本標準差為5,請問此母體平均數是否為45(在95%顯著水準下)?,統計學的種類,敘述統計(Descriptive Statistics) 樣本平均數、中位數、四分位數、變異數
2、、標準差推論統計(Deductive Statistics) 信賴區間估計(Confidence Interval)、假設檢定(Hypothesis Test)實驗設計 回歸分析(Regression)、變異數分析(ANOVA,ANalysis Of VAriance),敘述統計介紹平均數、標準差(1),A說:昨天晚上我和3個平均年齡只有24歲的小姐約會。B說:哇!茂死啊!茂死啊!A說:一點也不,年齡差距太大,一點也不起勁。B說:還好吧,你也才28歲而已!,只衡量數值集中的程度還不夠,還要衡量離散的程度!,敘述統計介紹平均數、標準差(2),離散的程度:全距(Range)、標準差(Standar
3、d Deviation)全距最大值-最小值樣本變異數Variance ,i=1,2,.n 其中 樣本標準差 s 三個樣本值分別為6, 6, 60 平均24;全距=54, 標準差s 31.177,敘述統計介紹中位數、四分位數,中位數:一群數值從小到大排列後,位於正中間的數。 (若為偶數個數值,則取最中間兩數的平均)四分位數:在此數值之下,有1/4或3/4的數值分佈。例子1:10個樣本值,由小到大排列,如下: 3,4,5,5,6,7,8,9,10,11求中位數?上四分位數(Q1)?下四分位數(Q3)? Ans:中位數(median)6.5 First Quartile (Q1) 5 Third Q
4、uartile (Q3) 8.75EXCEL、MINITAB都可以算出來;但Q1、Q3答案(公式)不一樣,敘述統計介紹箱型圖(Box Plot),作法:把最小值,Q1,中位數(=Q2),Q3,最大值畫出來。功用:可看出一群數值大致的分佈。接前例,5,6.5,8.75,最小值 Q1 中位數 Q3 最大值,常見機率分配常態分配(Normal Distribution)(1),常態分配特性:1.期望值 E(x)= .又稱mean2.變異數 V(x)=23.為左右對稱的分配,-x23.為左右對稱的分配4.當v ,t 分配近似於標準 常態分配,N(0,1),t(v),t(v),常見機率分配t分配 (3)
5、,設(X1,.,Xn)為抽自常態母體N(, 2)之一組隨機樣本,則:Proof:,用來檢定母體平均數,常見機率分配F分配 (1),設 與 為獨立隨機變數,且又令:則隨機變數F的機率分配是自由度v1與v2的F分配,記為FF(v1, v2),設(X1,.,Xn1)與(Y1,.,Yn2)為分別由常態母體N(1, 12)與N(2, 22)抽出的兩組獨立的隨機樣本,則:,常見機率分配F分配 (2),用來檢定兩母體標準差是否相等(1= 2),設(X1,.,Xn)為由常態母體N(, 2)抽出的一組獨立的隨機樣本。,母體mean之信賴區間估計Z分配 (1),Recall: Page 10,母體mean之信賴區
6、間估計Z分配 (2),表示:有95%信心,母體的 mean ()將在底下區間之內,如果要有99%信心的話呢?,母體mean之信賴區間估計Z分配 (3),定義:對於一常態分配母體的mean (),若已知其標準差為,則其100(1-)%的信賴區間為:,Example: 99%, Z/2=2.575 (查表可得,統計軟體會內建),現實問題是:不知道。,母體mean之信賴區間估計t分配 (1),對於一常態分配母體的mean (),若其母體標準差未知,求其100(1-)%的信賴區間t分配Recall:,其中,,i=1,2,n,母體mean之信賴區間估計t分配 (2),母體mean之信賴區間估計t分配 (
7、3),定義:對於一常態分配母體的mean (),若與S為其樣本平均值及樣本標準差,則其100(1-)%的信賴區間為:,查表得到或軟體內建,母體mean之信賴區間估計t分配 (4),例子:10, 13, 17, 14, 20, 15, 21, 18, 13, 20 為自一常態母體抽出的一組樣本。試求母體mean的95%信賴區間:,Ans:所以母體mean的95%信賴區間:,假設檢定(Hypothesis Test)概論 (1),動機:經由統計方法,拒絕一原始的假設。,原始假設:虛無假設(Null Hypothesis):希望被否定的統計假設,以H0表示之。另外假設:對立假設(Alternativ
8、e Hypothesis):由於否定虛無假設而被認為對的統計假設,以H1或Ha表示之。,H0:新藥不具療效,H1:新藥具有療效,利用數據及統計方法 去拒絕H0(接受H1 ),假設檢定(Hypothesis Test)概論 (2),檢定程序:,1.決定檢定統計量2.決定拒絕域(rejection region):與顯著水準有關當檢定統計量落入拒絕域,則拒絕H0,0,Z,(1-),H1,Z0Z則拒絕H0,假設檢定(Hypothesis Test)概論 (3),另一種表示檢定結果的方法:P-Value,1.以標準常態分配為例, P-Value=P(Z檢定統計量Z0) 2.當P-Value0 30,不管母體分配為何, 趨近常態實用經驗:若樣本本身的分佈是鐘型曲線(Bell-shape),則 樣本數 n只要等於4或5,不管母體分配為何, 趨近常態,最後的問題如何確保樣本統計量為常態分配?,謝謝各位!恭喜各位已經學到統計的入門,請繼續加油!,