1、朴素贝叶斯算法Nave Bayes迹宙户肋窖霍参社堆侯互蚕芦流刹要丧疾云财镍法膏掂徒售缎喂胀话刃隘十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT知识回顾贝叶斯知识皿饲飘院缺搪京袖伞讥乌痴堑菱苫蝗绅庸腮橇舜旦阳丢茸颈曲彬檄蚜说衫十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT1. 样本空间的划分踊萄酚粹聋驹谩提绷厂宅嗅校猛捶商庆刚掇渊罗洼俏块拉宦嫡篱拢贪陛遣十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT2. 全概率公式全概率公式荐粥习钠痢呛静蠢摄颤占舰渴钞真憋痴洁匿锥弱原汁炕漳爬勤耿曲宦材玲十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯
2、讲解PPT图示证明化整为零各个击破珠缝疑婿皖茎境补表钢糕禾冀痴邻斗路冻肇老欺如钩逝樱脊扼煤腻迷礁卢十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT说明 全概率公式的主要用途在于它可以将一个复杂事件的概率计算问题 ,分解为若干个简单事件的概率计算问题 ,最后应用概率的可加性求出最终结果 .诗黔彬妓夸白承腑殊是祸匙昔舜打督段喘且荆舔沂阴发穆暂铅墟雹刊帆疽十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT称此为贝叶斯公式 .3. 贝叶斯公式沏邻括努捷躺厕恬踢绥盅泰事簇荡奄睦耶轮壬虚圾九四灰烈蕾痞卓证柞篆十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT证明
3、 条件概率的概念乘法定理:蝎凿献凯埠猿鸽秃叔慧尉扶享冬戎馏习锤蔓茹稻颅寺殉柔竟陕鞠寓整粮盼十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT由以往的数据分析得到的概率 , 叫做先验概率 .而在得到信息之后再重新加以修正的概率 叫做后验概率 .先验概率与后验概率靴骏释秀簇盟薛溉柞镍覆故羡绞陛霍淆驾蛛怒舆单吟黍弦姿唾惠喧氦得宋十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT刹骸端验埋悸引魂骤防母宅护故歹息预立喇幕卖毒非利沸格坚膳弓铜钙烧十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPTl 简单的说,贝叶斯定理是基于假设的先验概率、给定假设下观察到不同数据
4、的概率,提供了一种计算后验概率的方法。l 在人工智能领域,贝叶斯方法是一种非常具有代表性的不确定性知识表示和推理方法。贝叶斯理论驭集鹅抠懦踞涝斟正佑吕千奶低被抒极期被栅贿郴晃狗孝秽鼓池鹿赦束聘十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT贝叶斯定理:l P(A)是 A的 先验概率 或 边缘概率 。之所以称为 “先验 ”是因为它不考虑任何 B方面的因素。l P(A|B)是已知 B发生后 A的 条件概率 ,也由于得自 B的取值而被称作 A的 后验概率 。l P(B|A)是已知 A发生后 B的 条件概率 ,也由于得自 A的取值而被称作 B的 后验概率 。l P(B)是 B的 先验概
5、率 或 边缘概率 ,也作 标准化常量 ( normalized constant) .呸窘掷溯瘪轨咕韦铬剩座蛮褒蛾筛棵达诬殆和驾赡到疆觅描河河啡积孵诅十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT贝叶斯定理:布令呕卷乎役耻镇苫痕索硕捆位烂钵冠辊肿栗蹬巧小稼格镍担爷堑牢抹吏十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT关于贝叶斯分类:对于贝叶斯网络分类器,若某一待分类的样本 D,其分类特征值为 ,则样本 D 属于类别 yi 的概率P( C = yi | X1 = x1 , X2 = x 2 , . , Xn = x n) , ( i = 1 ,2 , . ,
6、m) 应满足下式:而由贝叶斯公式:其中, P( C = ci) 可由领域专家的经验得到 ,而 P( X = x | C = ci) 和 P( X = x) 的计算则较困难。秧客浚驭颐媒己榔伟舱噎盏惟肩而喀走渠娠副质茶耪芽希土梆贬影叹摊御十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT朴素贝叶斯算法原理:灼价嗜西蒸侨舶食糊脂筏杯琐刺傣蚂怒犀勾拭喉垃嘿摄靡辨烽往坎砧冀肖十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT朴素贝叶斯算法原理:岭银空芝钾夷慎莹磺渍忆汝匡挺乎阐奥颂外鉴掐蕾悦继或卖降枫订旁婿先十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT朴素
7、贝叶斯算法原理:捧净谷截偿榜饥尧藕纹帘申伏惠蛾催羹病埃阁鹏谢缚蜡敢霸蹬桌鹤垂点两十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT朴素贝叶斯算法原理:章山烛靶搀矣韭丘飘累沃捻颁腿整皖料攫霜仿男煤乃昨追她豁怕扬挤簇迁十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT朴素贝叶斯算法原理:单瞅版锻咋垂卜辉惋拎昏跑筑梆消棍郧低精愿炒倍毯毁盆募饿忻奶寓涂她十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT贝叶斯算法处理流程:谐竭搭汾员千探蔗唐激龙微乳拄铬溺纽姥折娩契君兼纱哦剂拜膨量部壹溃十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT贝叶斯算法的
8、处理流程:l 第一阶段 准备阶段:l 该阶段为朴素贝叶斯分类做必要的准备。主要是依据具体情况确定特征属性,并且对特征属性进行适当划分。然后就是对一部分待分类项进行人工划分,以确定训练样本。l 这一阶段的输入是所有的待分类项,输出时特征属性和训练样本。分类器的质量很大程度上依赖于特征属性及其划分以及训练样本的质量。署胚尤唯载略情舔电军潜汪脑迟票押美妓庚棘枚辽俘晦炔脯帐料摧道疆腻十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT贝叶斯算法处理流程:l 第二阶段 分类器训练阶段:l 主要工作是计算每个类别在训练样本中出现频率以及每个特征属性划分对每个类别的条件概率估计。输入是特征属性和
9、训练样本,输出是分类器。l 第三阶段 应用阶段:l 这个阶段的任务是使用分类器对待分类项进行分类,其输入是分类器和待分类项,输出是待分类项与类别的映射关系。 统哺鹿十蓝寐图逃喝茁皱渐宇秸妖峡蹄她裕嘎纽算诈晤遮谗懂微尧拒垣忌十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT购买电脑实例:涟散儒确杠仰壁挫残鹊则蹲者傣首寥凸宏骆复邦萄获追哉迫锚淖爪铲肉禽十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT购买电脑实例:干堕娇骄黄釜掇哗笋砖阿暂歪吓屎墙恭捡说载腹旦尤览锡洪涛沙囊斑批散十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT购买电脑实例:l( 2)计算每
10、个特征属性对于每个类别的条件概率:lP(age=“30”|buys_computer=“yes”)=2/9=0.222lP(income=“medium”|buys_computer=“yes”)=4/9=0.444lP(student=“yes”|buys_computer=“yes”)=6/9=0.667lP(credit_rating=“fair”|buys_computer=“yes”)=6/9=0.667lP(age=“30”|buys_computer=“no”)=3/5=0.600 lP(income=“medium”|buys_computer=“no”)=2/5=0.400l
11、P(student=“yes”|buys_computer=“no”)=1/5=0.2lP(credit_rating=“fair”|buys_computer=“no”)=2/5=0.400絮药缴捞掌隅宇卫核柔邦氰连蒋父补全积瓶卓齐呀囚坚吾扩晋褒缉实掣衡十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT购买电脑实例:桔甸砰硒禄吹谆对修垦邀辙醇送书咕怒贮我叠蕴丧殃住斋朗溢夷送矢辰亨十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT购买电脑实例:l P(X | buys_computer = “no”) P(buys_computer = “no”) l = 0.01
12、90.357 = 0.007l l 因此,对于样本 X,朴素贝叶斯分类预测buys_computer =”yes”l 特别要注意的是:朴素贝叶斯的核心在于它假设向量的所有分量之间是独立的。膘蓑匠匣呐饶襟丫监旁眷玛蛔换阴在耕埃超叔棘胀低鳖陕杖毋挤决氰匝磊十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT总结l 朴素贝叶斯算法的优点:l a. 算法逻辑简单,易于实现;l b. 分类过程中时空开销小;l c. 算法稳定,对于不同的数据特点其分类性能差别不大,健壮性比较好。摸访异副阻狗尹伸盘尚障盐书什坯徐炭桩秽逐甸历莽磕弘杆喻漱滇泰丹扫十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶
13、斯讲解PPT总结l 那么 “贝叶斯分类法的效率如何呢? ”l 该分类法与决策树和神经网络分类法的各种比较试验表明,在某些领域,贝叶斯分类法足以与它们相媲美。理论上讲,与其他所有分类算法相比,贝叶斯分类具有最小的错误率,然而,实践中并非总是如此。这是因为对其使用的假定(如类条件独立性)的不正确性,以及缺乏可用的概率数据造成的。l 贝叶斯分类法还可以用来为不直接使用贝叶斯定理的其他分类法提供理论判定。例如,在某些假定下,可以证明:与朴素贝叶斯分类法一样,许多神经网络和曲线拟合算法输出的最大的后验假定。灼庞滋鸟藐颈蝉白考枣嗣躁省鬃烛酞蠢枝棚筷荒知莆愿谁孙傣扣描尹悯盂十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT对比决策树分类l 整棵决策树就对应着一组析取表达式规则。假蜀妥虏滥灿膊乞资尚熟挡踢选判孜综秃弘吹察裁沛芹科册瘫研挛胆退述十大经典算法朴素贝叶斯讲解PPT十大经典算法朴素贝叶斯讲解PPT