1、简单关联规则原理,关联规则:主要用于研究超市顾客购买商品之间的规律,目的是希望找到顾客经常同时购买的商品,进而合理摆放货架,方便顾客选取,该分析亦称为购物篮分析。分析对象:事务(一种行为,如顾客的一种购买行为),数据示例如下表:,一、基本概念,统计数据化处理为: 把商品看成一个集合X,则子集X(ACD)代表顾客001购买情况。进一步处理成事实表如下: 事实表中,变量名为具体项目,变量值为1或0,1代表购买,0代表没有购买。,简单关联规则的一般表达式:Xm Xn (S, C)其中Xm 为规则的前项, Xn 为规则的后项,两者均为X项集的子集,代表顾客的某一种购买行为。(在购物篮分析中)规则的含义
2、为(在购物篮分析中),顾客购买Xm 商品(组合)就很有可能购买Xn 商品(组合)。S 代表该规则的支持度,C代表规则规则的置信度,两者为该项规则的评价指标。,二、关联规则的构建,规则支持度(S):测度规则的普遍性,表示项目Xm ,Xn 同时发生的概率 T( Xm Xn ) S= T( X)T( X)表示总项目数。支持度太低,表示规则不具有一般性,规则无价值。规则置信度(C):表示规律规则的准确性, Xm 发生时, Xn 发生的概率。 T( Xm Xn )C= T(Xm),三、关联规则的评价,三、关联规则的评价,规则提升度(L):反映项目Xm 的出现对项目Xn 的影响程度,一般大于1才有意义,意味着前项对后项有促进作用,L值越大越好。L=C/S(Xn ) 规则置信度与后项支持度的比。部署能力(Deployability),测度了样本中仅满足前项的情况:S(Xm )-S 补充指标:置信差:D= C- S(Xn )置信率: R=1-minC/ S(Xn ), S(Xn )/C*正态卡方 *信息差(交互熵),THE END,