ImageVerifierCode 换一换
格式:PPT , 页数:15 ,大小:576KB ,
资源ID:1178122      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-1178122.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(关联关系(一).ppt)为本站会员(天天快乐)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

关联关系(一).ppt

1、第2章 基本数据挖掘技术 之 二,关联规则,2.2 关联规则,关联分析(AssociationAnalysis)关联分析是发现事物之间关联关系(Associations)的分析过程。典型应用就是购物篮分析(MarketBasketAnalysis)。购物篮分析确定顾客在一次购物中可能一起购买的商品,发现其购物篮中不同商品之间的联系,分析顾客的购买习惯,从而发现购买行为之间的关联。关联关系以一组特殊的规则形式出现关联规则(Association Rules),2018年6月17日星期日,第2页,共15页,2.2.1 关联规则概述,一般表现为蕴涵式规则形式:XY。其中X和Y分别称为关联规则的前提或

2、先导条件(Antecedent)和结果或后继(Consequent)。关联规则与产生式规则有两点不同(1)在某条关联规则中以前提条件出现的属性可以出现在下一条关联规则的结果中。(2)传统的用于分类的产生式规则的结果中仅能有一个属性,而关联规则中则允许其结果包含一个或多个属性。,2018年6月17日星期日,第3页,共15页,【例2.4】,根据顾客实际购买行为数据(表2.3,值为1表示购买了该种商品;值为0表示未购买该种商品),分析顾客在网络购物中购买图书、运动鞋、耳机、DVD和果汁五种商品时,是否存在购买行为上的关联。,表2.3 网络购物交易记录表,2018年6月17日星期日,第5页,共15页,

3、表2.3 网络购物交易记录表,置信度(Confidence)和支持度(Support),若得到4条关联关系(1)如果顾客购买了Sneaker(运动鞋),那么他们也会购买Earphone(耳机)。(2)如果顾客购买了Book(图书),那么他们也会购买Juice(果汁)。(3)如果顾客购买了Book(图书)和DVD,那么他们也会购买Earphone(耳机)。(4)如果顾客购买了Book(图书)、Sneaker(运动鞋)和Earphone(耳机),那么他们也会购买DVD。使用置信度度量每个关联规则在前提条件下结果发生的可能性。关联关系(1)的置信度为:3/5 = 60%。使用支持度度量包含了关联关系

4、中出现的属性值的交易占所有交易的百分比。关联关系(1)的支持度为:3/10 = 30%关联分析过程中设置置信度和支持度的阈值,当得到的关联关系达到置信度和支持度的阈值时,这样的关联关系被认为是有趣的,而保留下来应用到实际问题中。,2018年6月17日星期日,第6页,共15页,2.2.2 关联分析,1993年,阿戈沃(Agrawal)等人提出了著名的关联分析算法Apriori算法。Apriori算法的基本思想(1)生成条目集(Item Sets)。条目集是符合一定的支持度要求的“属性-值”的组合。那些不符合支持度要求的“属性-值”组合被丢弃,因此,规则的生成过程可以在合理的时间内完成。(2)使用

5、生成的条目集创建一组关联规则。,2018年6月17日星期日,第7页,共15页,【例2.5】,将表2.3作为数据集,使用Apriori算法进行关联分析,产生描述网络购买行为的关联规则。,步骤,(1)设置支持度阈值为50%,创建第一个条目集表,包含单项条目。,2018年6月17日星期日,第9页,共15页,表2.4 网络购物行为关联分析条目表1,步骤,(2)设置支持度阈值为40%,创建第二个条目集表,包含双项条目,2018年6月17日星期日,第10页,共15页,表2.5 网络购物行为关联分析条目表2,步骤,(3)仍将支持度阈值设置为40%,使用双项条目表中的“属性-值”组合生成三项条目集,有两条条目

6、。Book =1 & Earphone = 1& DVD = 1Sneaker =0 & Earphone = 1 & DVD = 1(4)再次将支持度阈值设置为40%,以三项条目集为基础,生成四项条目集,没有符合支持度要求的条目,条目集生成工作结束。,2018年6月17日星期日,第11页,共15页,步骤,(5)以生成的条目集为基础创建关联规则。首先设置置信度阈值为80%;然后从双项和三项条目集表中生成关联规则;最后,所有不满足置信度阈值的规则将被删除。以双项条目集中的第一条条目生成的两条规则IF Book =1 THEN Earphone = 1 (置信度:4/5 = 80%,保留)IF E

7、arphone = 1 THEN Book =1(置信度:4/7 = 57.1%,删除)以三项条目集中的第一条条目生成的三条规则IF Book =1 & Earphone = 1 THEN DVD = 1(置信度:4/4 = 100%,保留)IF Book =1 & DVD = 1 THEN Earphone = 1(置信度:4/4 = 100%,保留)IF Earphone = 1 & DVD = 1 THEN Book =1(置信度:4/6 = 66.7%,删除),2018年6月17日星期日,第12页,共15页,【例2.6】,使用Weka的Apriori算法为表2.3生成关联规则。,实验结果,2018年6月17日星期日,第14页,共15页,图2.17Apriori算法输出结果,2.2.3 关联规则小结,优势关联规则不受因变量个数的限制,能够在大型数据库中发现数据之间的关联关系,所以其应用非常广泛。局限性一次关联分析输出的规则往往数量较多,且多数并无利用价值,所以对关联规则的解释和应用必须谨慎。,2018年6月17日星期日,第15页,共15页,

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报