1、第五章 機率論,學 習 目 標,介紹機率的基本觀念如隨機試驗、樣本點、樣本空間、事件等。了解古典機率理論、客觀機率理論及主觀機率理論。學習事件機率、聯合機率、邊際機率及條件機率之定義及其應用。如何應用貝氏定理。,本 章 架 構,5.1 機率(probability)基本觀念5.2 機率(probability)定義5.3 事件(event)及 事件機率(event probability)的定義5.4 貝氏定理(Bayes theorem),機率簡史,機率論之起源據說是由於投骰子,卡片,錢幣等之賭博遊戲之流行及保險之發生而產生。其發展之動機是當時商業資本家作如此打賭之交易時,認為要依靠占星術不
2、如依靠較為確實可以致富之學術界。 16-17世紀數學者大約完成古典機率論。在當時由於數學史上微積分之發明,機率論亦因而應用此法。古典機率論的內容由組合論進入幾何學的機率論,更與誤差論聯結出現解析的機率論。在此間由 De Moivre、James Bernoulli 等所展開之古典的推測論中始確立大數法則,更進一步的到 Gauss、Laplace 時發現中央極限定理。此大數法則對古典統計學提供大數觀察之理論基礎,意義甚大。中央極限定理是誤差論之一支柱且成為最小自乘法的背景。 資料來源:姚景星教授 機率之回顧,5.1 機率基本觀念,5.1.1 隨機試驗(random experiment)、 樣本
3、點(sample point)及樣本空間(sample space)5.1.2 計數法則,5.1.1 隨機試驗、樣本點及樣本空間,隨機試驗(random experiment): 在實驗之前已知所有可能發生的結果,但卻無法預知會發生何種結果的實驗方式。樣本點(sample point): 隨機試驗之每個可能出現的結果(outcome)稱為樣本點。樣本空間(sample space): 隨機試驗之所有樣本點所形成的集合,稱為樣本空間,通常以英文大寫字母S表示之。,5.1.1隨機試驗、樣本點及樣本空(續),表5.1 隨機試驗、樣本點及樣本空間,5.1.2 計數法則,樹狀圖(tree diagram
4、): 藉由樹狀圖可了解隨機試驗的過程及其所有可能的結果,如下圖所示。圖5.1 丟擲兩個銅板的樹狀圖,5.1.2 計數法則(續),多步驟隨機試驗之計數法則: 若一個隨機試驗係由 k 個步驟所形成,而第一步驟有n1種可能結果,第二步驟有n2種可能結果,依此類推,第 k 步驟有nk種可能結果,則此隨機試驗共有n1 n2 nk種可能結果,即此隨機試驗之樣本點數為各步驟可能結果個數之乘積。,例5.1 衣服的搭配方式,陳先生衣櫃中有10件襯衫、6件長褲、3件外套及8條領帶,現陳先生要選擇1件襯衫、1件長褲、1件外套及1條領帶搭配,問共有多少種可能的搭配方式?解: 此隨機試驗係由4個步驟所形成,第一步驟選擇
5、襯衫,有10種選擇的方式;第二步驟選擇長褲,有6種選擇的方式;第三步驟選擇外套,有3種選擇的方式;第四步驟選擇領帶,有8種選擇的方式; 故共有10 6 3 8 1,440種搭配方式。,5.1.2 計數法則(續1),排列(permutation): 從n個不同的物體中,抽取r個物體依序安排在r個位置,則共有n (n1) (n2) (nr 1)種不同的排列方式,一般以 表示。此處, 。組合(combination): 從n個不同的物體中抽取r個物體,則共 種選法。此處,,例5.2 班級幹部之選取,一班有60位學生,從中選取3位分別擔任班代、服務股長及康樂股長,問有多少種可能的情況?解: 因班代、服
6、務股長及康樂股長表示3個不同的位置。故 班代 服務股長 康樂股長 60 59 58 205,320 種可能的情況, 或 。,例5.3 金融卡密碼之選取,陳先生設定四個不相同數字為金融卡之密碼,問有多少種可能的方式?解: 種可能的方式。,例5.4 樂透彩券號碼之選取方式,目前正流行的樂透彩券,其玩法係從1至42號碼中選取6個不同的號碼,那麼究竟共有多少種選法?解: 。,台灣的樂透彩與美國比較,美國樂透動輒要一、二十期才會有人拿到頭彩,我們中華民國,每期便有三五個人平分頭彩;更誇張的是:還有人一次買兩張相同的號碼,一次中個雙囍臨門。 拿台灣的樂透彩跟美國比較,其實是有問題的,國外一、二十期中一次是
7、因為49選6的關係。我們運用數學的機率來算看看。 國內樂透中六星的機率: 美國樂透中六星的機率: 由此可見,國內簽注樂透中頭彩的機率,是美國的3倍。加上台灣民眾賭性堅強,個人花上數百萬包牌、甚至組織串聯集資簽注幾乎已經不是新聞了,每一期中樂透的人數超過一人,的確有它的理由存在。,購買彩券前您不可不知的守則,根據專家表示,你每投資五十元,就有機會回收廿八元;然而摃龜機率超過97%。以下就是專家的分析: 摃龜組合:以 42 選 6 的現行規則,總共會有5,245,786種組合,在這些組合中六個號碼都不中的有 1,947,792 種組合;只中一個號碼的有 2,261,952 種組合;只中兩號碼的有8
8、83,575 種組合,以上三種組合一共是 5,093,319 種摃龜組合,也就是不會中獎的組合佔97.09%。 會中獎的號碼只有152,467組,這152,467組會中獎的號碼組當中分別為: 普獎(中三碼)142,800 種 (2.2722%)四獎(中四碼)9,450 種 (0.18%)三獎(中五碼)210 種 (0.004%)二獎(中五碼再加中特別碼)6 種 (0.0001%)頭獎(六碼全中)1 種。,5.2 機率定義,5.2.1 相對次數法5.2.2 古典方法5.2.3 主觀法,5.2 機率定義(續),機率: 係衡量隨機試驗之各種結果發生的可能量數。條件:機率值必須介於0與1之間,若該隨機
9、試驗結果不發生,則其機率等於0;若該隨機試驗結果一定發生,則機率等於1。所有隨機試驗結果發生機率的總和必須等於1 。,5.2.1 相對次數法,相對次數法: 在相同情況下,重複進行隨機試驗,經過長期重複試驗許多次後,試驗結果E發生的機率,以P(E)表示,則 , 其中 n(E)表示試驗結果E實際發生的次數,n表隨機試驗總次數。,保險基本原理大數法則,大數法則是指一件事重覆發生的次數很多時,其發生的機率就會接近真實的情形。 假定吾人觀察某事件在進行反覆N次以後,會有R次特定狀況出現。當觀察越多次時,R/N會趨近於定值的一種現象。如果上述的N是參與保險的單位,R是危險發生的次數,即適合用保險來處理的危
10、險。用保險的語言來說,即有夠多的危險單位存在時,即可統計出一穩定的損失機率。這也是保險費率訂定的基礎。 大數法則運用在保險上面最常見的就是死亡率,壽險業利用臺灣壽險業第三回經驗生命表來計算保費的基準,臺灣壽險業第三回經驗生命表是以一千萬人為基準的。,例5.5 一個均勻銅板出現正面的情形,分別重覆丟擲一個均勻的銅板10次、100次、1,000次及10,000次,其出現正面的次數如表5.1所示,由表5.1可看出,隨著試驗次數之增加,出現正面的比例愈來愈接近0.5。表5.2 丟擲一個均勻銅板的結果統計表,5.2.2 古典方法,古典方法: 假設每一種隨機試驗結果出現的可能性皆相等之情況下,衡量各隨機試
11、驗結果發生之機率的方法,稱之。計算法則: 如果一個隨機試驗有n(S)個,則各隨機試驗結果發生之機率皆為 。,例5.6 丟擲一個均勻骰子的情形,丟擲一個均勻的骰子一次,其樣本空間為 因為這是一個均勻的骰子,故假設每一個隨機試驗結果發生的可能性皆相等。即,例5.7 誰出公差呢?,全班有60位學生,從中抽取一位學生出公差,每個人被抽到的機率皆為1/60。,5.2.3 主觀法,主觀法: 在相對次數法與古典法均不適用的情況下,利用所有相關的資料加上經驗與直覺,衡量某一特定隨機試驗結果發生之機率值,稱之。,例5.8 誰會當選立法院副院長呢?,江丙坤與洪奇昌委員競選第五屆立法院副院長,每位候選人當選的可能性
12、不需要相等,且又不能重覆進行投票,故雙方人馬根據所有可用的訊息估計江委員或洪委員當選之機率。,預測的主觀方法德非法( Delphi Survey ),德非調查法 有三個主要性質:第一,探討的問題是非常專業的問題;其次,調查的對象是專業的菁英;最後,它的功能是決策與溝通,而前者又包含評估和預測兩個層次。相對於一般意見調查是一種公眾性態度的調查;德非調查法是一種專家性、行動或預言的調查。 德非調查法的誕生基於三個理論,其一,處理專業問題,專家和普通人的正確程度不同,專家擁有一種主觀的先知機率,較為正確。第二,如果對於一個抽象事物反復測量,最後會獲得一個比較穩定、正確的平均結果。其三,三個臭皮匠抵過
13、一個諸葛亮,經由團隊作用,一群專家的預測力抵得上阿波羅。,5.3 事件及事件機率的性質,5.3.1 事件(event)的基本性質5.3.2 事件機率(event probability)5.3.3 聯合機率(joint probability)及 邊際機率(marginal probability)5.3.4 條件機率(conditional probability)5.3.5 機率的性質,5.3.1 事件的基本性質,事件(event): 樣本空間的部分集合稱為事件。簡單事件: 只包含一個樣本點的部分集合稱為簡單事件。複合事件: 包含二個或二個以上樣本點的部分集合稱位複合事件。,5.3.1 事
14、件的基本性質,事件的基本性質: (1) P(S) = 1, P() = 0 (2) 0 P(E) 1,例5.9 從球袋中抽取一球,假設一球袋內有1、2、3號球,現從袋內抽取一個球,則其樣本空間為1,2,3,試問其部分集合為何? 解:共有 個部分集合,包括空集合:一定不會發生之事件。簡單事件:1、2、3 。複合事件:1,2、1,3、2,3、1,2,3,其中 1,2,3為一定發生之事件。,5.3.1 事件的基本性質(集合論),事件的餘集(complement of event)係指樣本空間中不包含A事件之所有樣本點形成之集合,以Ac表示之。如圖5.2所示。圖5.2 事件A的餘集(complemen
15、t of event A) 註: (i) (Ac)c = A (ii) AAc = , AAc = S(樣本空間),A,Ac,5.3.1 事件的基本性質(續2),事件A和B的交集,表示在A和B中共同出現的樣本點所形成之集合,以AB表示之。如圖5.3所示。 圖5.3 事件A和B的交集P(AB) = n(AB)/n(S),A,B,5.3.1 事件的基本性質(續3),事件和的聯集表示所有屬於或或兩者都有的樣本點所形成之集合,以AB表示之。如圖5.4所示。圖5.4 事件A和B的聯集n (AB) = n(A) + n(B) n(AB) P(AB) = P(A) + P(B) P(AB),A,B,5.3.
16、1 事件的基本性質(續3),3. 差集(Different set): 以A-B表示 n(A-B) = n(A) n(A B) P(A-B) = P(A) P(A B) 註: A-B = A Bc 4. 其它集合: (i) (A B)c = AcBc (ii) (A B)c = AcBc (iii) (A-B)c = (A Bc)c = AcB,互斥事件與周延事件,定義: 互斥事件(Exclusive event) 若AB = ,則A , B為互斥事件例: AAc = ,所以A , Ac為互斥事件定義: 周延事件(Exhastive event) 若A B = S ,則A , B為周延事件例:
17、 AAc = S,所以A , Ac為周延事件定理:若AB = ,則P(A B) = P(A) + P(B)例: 若 A , B為互斥事件且A , B為周延事件,已知p(A) = 3P(B),求P(B) 。,5.3.2 事件機率,事件機率(event probability): 事件A發生之機率P(A) 為事件A之樣本點出現機率的總和,A = e1, e2, em, 即P(A) = P(ei) ,eiA。例: 投擲一個不公平骰子, 已知奇數點出現率為偶數點2倍 , 求投出為完全平方點的機率。 利用P(S) =1,例5.10 接續例5.6,丟擲一個均勻的骰子一次,出現偶數的機率為何? 解: 由例5
18、.9可知,其樣本空間,且每一樣本點出現的機率皆為,假設A為出現偶數的事件,則故其發生的機率為 另解: 因為每一樣本點出現的機率皆相等,故亦P(A)可定義為事件所包含之樣本點個數與樣本空間之樣本點總個數之比值,即 。故此題亦可作為 。,例5.11 丟擲一個不均勻的骰子,丟擲一個不均勻的骰子一次,其出現2的機率為,而其他樣本點出現的機率皆相等,問出現偶數的機率為何?解:此隨機試驗各樣本點出現之機率為 ,所以 令A為偶數點事件,5.3.3 聯合機率及邊際機率,聯合機率(joint probability): 兩個或兩個以上分類的事件同時發生的機率,稱為聯合機率。 如: P(A B) 邊際機率(mar
19、ginal probability): 在有兩個或兩個以上類別的樣本空間中,若僅考慮某一類別個別發生的機率者,稱為邊際機率。 如: P(A), P(B),例5.12 家庭中母親與女兒就讀大學之情況,調查某城市80個家庭其母親及女兒就讀大學之情況,如表5.2所示。問母親及女兒都讀過大學之機率為何?表5.2 80個家庭其母親及女兒就讀大學統計表,例5.12 解答,令 A1表示母親讀過大學的事件 A2表示母親未讀過大學的事件 B1表示女兒讀過大學的事件 B2表示女兒未讀過大學的事件,例5.12 解答(續),由表5.2可獲得下列之聯合機率值:母親及女兒都讀過大學之機率=母親讀過大學但女兒未讀過大學之機
20、率=母親未讀過大學但女兒讀過大學之機率=母親及女兒都未讀過大學之機率=,例5.12 解答(續1),表5.3 80個家庭其母親及女兒就讀大學之聯合機率表,例5.13 接續例5.12,接續例5.12,問母親讀過大學之機率為何? 解: 由題意,本題所要求的是母親讀過大學的邊際機率,由於A1、A2、B1及B2之邊際機率分別為 故母親讀過大學之機率為0.3。,5.3.4 條件機率,條件機率(conditional probability): 令A、B為定義於樣本空間的事件,在已知事件B發生的條件下,事件A發生的機率,即稱為事件A的條件機率。條件機率定義為聯合機率和邊際機率的比值,其可表示為 ,其中,P(
21、A B)表事件A與B同時發生的聯合機率,P(B)表事件B發生的機率。註: (i) P(A | B) = n(A B)/ n(B) = P(A B) / P(B) (ii) P(A) = P(A|S) (iii) P(A | B) , P(A)意義不同且無法確定孰大,5.3.4 條件機率,註: P(A B) = P(A | B) P(B) = P(B | A) P(A) 聯合機率 條件機率邊際機率定理: P(A | B) + P(Ac |B) = 1註 : P(A) + P(Ac) = 1 P(A | S) + P(Ac |S) = 1定理: 若A , B為互斥事件 , P(A | B) = 0
22、 , P(Ac |B) = 1 。 (即 P(A | B) + P(Ac |B) = 1 )註 : P(A|B) + P(A|Bc) 1,例5.14 接續例5.12,接續例5.12,已知該家庭母親讀過大學,問該家庭女兒也讀過大學之機率為何? 解: 原本家庭女兒讀過大學之機率為0.5,但若已知該家庭母親讀過大學之情況下,其女兒亦讀過大學之機率提高為 。例: 有四張紙1張為 “O” , 另3張均為 “” 。今有4個人以下兩種方式各抽一張。試求每人抽到“O”的機率。 (1) 同時抽 (2) 一個一個依序抽 解:每人抽到“O”的機率均1/4 (兩種抽取方式都一樣),5.3.5 機率的性質,加法法則:
23、係計算兩事件聯集的機率,其可表達為乘法法則: 計算兩事件交集的機率,其係由條件機率的定義而來,可表達為計算三個事件交集的機率,其可定義為,5.3.5 機率的性質(續1),獨立事件(independent events) : 係指一事件的發生不會影響立一件事件發生的機率,所以若A、B兩事件合乎於下列任一條件,則A、B互為獨立事件。1. P(A | B) = P(A) , 2. P(B | A) = P(B)定理:P(A B) = P(A) P(B) A、B互為獨立事件例: 續前例 , P(B1|A1) = 2/3 , P(B1) = 0.5 因為P(B1|A1) P(B1) , 所以B1 , A
24、1為相依事件定理:若A , B為獨立事件則A , Bc ; Ac, B ; Ac, Bc均各為獨立事件例: 5.12 (p.113)Ai , Bi為不獨立事件, i = 1, 2,獨立事件,A、B 、C為獨立事件 P(A B) = P(A)P(B) P(A C) = P(A)P(C) P(B C) = P(B)P(C) P(A B C) = P(A)P(B)P(C)註: 若P(A B) = P(A)P(B) , P(A C) = P(A)P(C) , P(B C) = P(B)P(C) , 但 P(A B C) P(A)P(B)P(C) 則 A , B , C 為兩兩獨立 (pairwise
25、independent) , 即A、B 、C不為獨立事件 。例: 令S = 1, 2, 3, 4 , A = 1, 2, B = 1, 3, C = 1, 4, 則 A , B , C 為兩兩獨立 事件,5.3.5 機率的性質(續2),相依事件(dependent event): 係指一事件的發生會影響其他事件發生的機率。 ( 即P(B|A) P(B) 為相依事件互斥事件(mutually exclusive events): 係指兩事件沒有共同的樣本點。 ( 即A B = ) 註:兩非空集合事件互斥事件與獨立事件不會同時發生,5.3.5 機率的性質(續3),分割集合: 若A1, Ak事件具有
26、下列性質,則稱A1, Ak,為一分割集合(partition set) 。 A1, Ak事件彼此互斥,即P(Ai Aj) = 0,對所有的 i j 。A1,Ak事件組成樣本空間,即S = A1 A2 Ak (即A1,Ak周延事件)。例: A與Ac為分割集合,例5.15 電腦公司員工離職的原因,根據一電腦公司人事經理指出,該公司員工離職的原因,有25%是對薪資不滿意,有15%是對工作環境不滿意,而有10%是同時對薪資及工作環境不滿意,請問員工離職的原因是對薪資不滿意或工作環境不滿意或兩者皆不滿意之機率為何? 解:令 A表示員工離職是因為對薪資不滿意的事件 B表示員工離職是因為對工作環境不滿意的事
27、件 因此,題意即在求事件 發生的機率 , ,,例5.16 抽球的順序會影響機率嗎?,一個袋子內有兩個白球及一個紅球,現有三人以不放回的方式依序從袋內抽出一個球,請問這三人分別抽到紅球的機率會因抽取的順序不同而差異嗎? 解:令註:三人同時抽球,抽到紅球的機率會均與上面結果 相同。,例5.16 解答,例5.17 使用信用卡付賬之情況,某一加油站經理根據過去經驗表示,有60%顧客會使用信用卡付賬,如果每位顧客是否使用信用卡付賬不會彼此互相影響,試問下兩位顧客都使用信用卡付賬之機率為何? 解:,例5.18 接續例5.14,接續例5.14,請問女兒讀過大學是否與母親讀過大學有關? 令 A1表示母親讀過大
28、學的事件 A2表示母親未讀過大學的事件 B1表示女兒讀過大學的事件 B2表示女兒未讀過大學的事件,例5.19 撲克牌之抽取,自52張撲克牌以不放回的抽取2張牌,假設A表示抽取的第一張牌為Ace的事件,B表示抽取的第二張牌為Ace的事件,試問A、B兩事件彼此獨立嗎?解: 所以A、B兩事件彼此不獨立,而是相依事件。,5.4 貝氏定理,分割定理: 若A1,Ak為一樣本空間之分割集合,B為某特定事件,則,5.4 貝氏定理(續),貝氏定理(Bayes theorem): 若已知A1,Ak為一樣本空間的分割集合,B為某特定事件, 且已知P(Ai)及P(B|Ai),則在已知B事件發生之條件下,Ai事件發生之
29、機率為P(Ai | B) 其中, P(Ai)為事前機率,P(B | Ai)為條件機率, P(Ai | B)為事後機率(posterior probabilities)。,5.4 貝氏定理(續1),貝氏定理進行的程序,例5.20 不良零件來自何處?,例如某公司生產之主要產品所需之零件係由三家不同的供應商(甲、乙、丙)供應,其供貨比例分別為50%、30%及20%,而各供應商公或的不良率分別為1%、3%及2%,表5.4為各供應商所提供之零件分別為良品及不良品的條件機率。現自所有零件中抽取一個,若該零件被發現係不良品,請問該零件最可能來自於那家供應商?表5.4 各供應商提供之零件為良品及不良品的條件機
30、率,例5.20 解答,假設A1表示該零件來自於甲供應商的事件A2表示該零件來自於乙供應商的事件A3表示該零件來自於丙供應商的事件B表示該零件是不良品的事件,則 , , , ,,例5.20 解答(續),例5.20 解答(續1),因為為最大,故該零件最可能來自於乙供應商。,利用貝氏定理處理泡水車問題,台灣近年颱風頻繁,導致泡水車增加,假設目前泡水車佔二手車市場有30%,今某人想在二手車市場買車,且透過專家朋友建議作決定。假設此專家朋友對於泡水車之鑑定有80%準確度,而非泡水車有10%誤判。試回答下列情況下此人買到泡水車之機率。 (1)無專家朋友建議 (2)專家朋友判斷為泡水車 (3)專家朋友判斷為
31、非泡水車 Sol: 令D表車子為泡水車之事件, G表車子為非泡水車之事件, Y表專家朋友認為車子為泡水車事件 N表專家朋友認為車子為非泡水車事件,利用貝氏定理處理泡水車問題,(1) P(D) = 0.3 (2) P(Y) = P(Y|D)P(D) + P(Y|G)P(G) = 0.80.3 + 0.10.7= 0.31 P(D|Y) = P(DY) / P(Y) = P(Y|D)P(D) / P(Y) = 0.80.3 / 0.31 = 24/31 0.3 (3) P(N) = P(N|D)P(D) + P(N|G)P(G) = 0.20.3 + 0.90.7 = 0.69 P(D|N) = P(DN) / P(N) = P(N|D)P(D) / P(N) = 0.20.3 / 0.69 = 6/69 0.3,