ImageVerifierCode 换一换
格式:PPTX , 页数:13 ,大小:1.09MB ,
资源ID:2258782      下载积分:25 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-2258782.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(课件五关联规则算法介绍及实现.pptx)为本站会员(微传9988)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

课件五关联规则算法介绍及实现.pptx

1、关联规则算法介绍,信息技术局数据分析团队 2012-3-28,关联规则算法介绍及实现,关联规则算法总体介绍,该算法的R语言实现,1.1什么关联规则算法? 1.2三个关键概念 1.3用途范围,1.1什么是关联规则挖掘,定义:关联规则反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系,那么,其中一个事物就能够通过其他事物预测到。 典型的关联规则发现问题是对超市中的货篮数据(Market Basket)进行分析。通过发现顾客放入货篮中的不同商品之间的关系来分析顾客的购买习惯。,1.1什么是关联规则挖掘,背景: 首先被Agrawal在1993年的SIGMOD会议

2、上提出 在事务、关系数据库中的项集和对象中发现频繁模式、关联规则、相关性或者因果结构 目的: 发现数据中的规律 超市数据中的什么产品会一起购买? 啤酒和尿布 在买了一台PC之后下一步会购买?,1.2 三个关键概念,支持度 如果项集X是事务T的一个子集,则称T包含X。对于一个规则XY的支持度是指“T中包含XY的事务的百分比”。设n是T中的事务的数目。对于规则XY的支持度计算如下:支持度= 置信度 对于一个规则XY的置信度是指“T中既包含X也包含Y的事务占所有包含X的事务的百分比”。置信度=,1.2频繁项目集,最小支持度minsup。即用户规定的关联规则必须满足的最小支持度,它表示了一组物品集在统

3、计意义上的需满足的最低程度。 最小置信度minconf。即用户规定的关联规则必须满足的最小置信度,它反应了关联规则的最低可靠度。 数据集中的任意一项集Ix,如果 Support(Ix)min-sup,则称项集Ix为非频繁项目集。 数据集中的任意一项集Ix,如果 Support(Ix)min-sup,则称项集Ix为频繁项目集。,1.3应用范围,例如:啤酒和尿布的关联关系 推断客户的潜在消费需求 制定产品组合销售策略,关联规则算法总体介绍,R语言实现,2.1生成标准数据集 2.2计算过程 2.3选择规则集,关联规则算法介绍及实现,2.1生成标准数据集,购物篮格式数据集 A m、n、l、p B m、

4、n C n、l 单一格式数据集A m A nB m ,2.2计算过程,library(arules) #加载arules程序包 data(Groceries) #调用数据文件 frequentsets=eclat(Groceries,parameter=list(support=0.05,maxlen=10) #求频繁项集 inspect(frequentsets1:10) #察看求得的频繁项集 inspect(sort(frequentsets,by=“support“)1:10) #根据支持度对求得的频繁项集排序并察看,2.2计算过程,rules=apriori(Groceries,par

5、ameter=list(support=0.01,confidence=0.01) #求关联规则 summary(rules) #察看求得的关联规则之摘要 x=subset(rules,subset=rhs%in%“whole milk“&lift=1.2) #求所需要的关联规则子集 inspect(sort(x,by=“support“)1:5) #根据支持度对求得的关联规则子集排序并察看,2.3选择有效结果集,以置信度为核心 兼顾支持度 结果集示例:lhs rhs support onfidence lift 1 36-817aa = 36-818aa 0.11283015 0.74416910 4.344507 2 36-818aa = 36-817aa 0.11283015 0.65870968 4.344507 3 36-628aa = 36-62aa 0.10343684 0.98113208 6.131398,数据字段清洗规则,该分析方法的总结,1、针对多指标综合分类 2、后续需要进一步采用决策树算法进行规则提炼 和验证。 3、该类分析方法的不足有那些?如何尽量避免?,关联规则挖掘在商品组合的选择以及客户行为的分析中发挥着非常重要的作用,是一种非常简单而实用算法!谢谢大家!,

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报