1、数据仓库与数据挖掘第五组:闫渊杜航唐宇微,题目:如何利用促销产品以提高企业利润,利用sales_fact_1997, promotion, time_by_day, product表做关联分析 提取97年前9个月数据做训练集 后3个月数据做验证集 以分析促销产品的选择如何带动其他 产品的销售使企业利润增加,1.数据清理,把没购买促销产品的顾客清理 2.数据集成,提取所需属性集成一个新表 3.使用关联规则算法进行分析 4.利用分析结果,给企业提出合理性建议。,以下是关联过程部分截图:,关联分析中关联度较大的产品组合结果:,ebony 蘑菇,红翼AA型电池 -华盛顿浆果果汁 ebony 蘑菇,bi
2、rd call儿童阿司匹林 -华盛顿浆果果汁 cormorant 25瓦灯泡,landslide菜籽油-华盛顿浆果果汁 high top土豆,club muenster 奶酪-华盛顿浆果果汁 high top土豆,快速低脂肪炸薯条-华盛顿浆果果汁 high top土豆,sunset bees蜡烛-华盛顿浆果果汁 club muenster 奶酪,快速低脂肪炸薯条-华盛顿浆果果汁 club muenster 奶酪,sunset bees蜡烛 -华盛顿浆果果汁 colony小麦面包,快速萨尔萨水-nationeel dried dates 卡林顿冷冻鸡翅膀,tell tale fancy李子-na
3、tioneel火锅组合 华盛顿浆果果汁,最佳选择咸饼干-ebony 蘑菇 华盛顿浆果果汁,红翼AA型电池-ebony 蘑菇 华盛顿浆果果汁,bird call儿童阿司匹林-ebony 蘑菇注释:破折号前为促销品,破折号后为关联分析所取得购买时点的非 促销产品,根据以上分析结果对企业给出以下建议:,因为促销品的利润较低,但可以很好的吸引消费者,所以在促销活动期间适当提高与促销品关联购买度高的产品的价格,可以提高销售产品的整体利润。 即在以上分析结果中,在进行促销活动时适度提高破折号后的产品的价格,可以使破折号前的产品的利润损失得到补偿,并且破折号前的两种产品进行组合促销可以更大程度促进关联产品的
4、购买,以提高整体利润。,以下是程序部分:,select time_id,customer_id,SUM(promotion_id) sum_prominto sum_promfrom sales_fact_1997 group by time_id,customer_id having SUM(promotion_id)!=0order by time_id go select product_id,sales_fact_1997.time_id,sales_fact_1997.customer_id,promotion_idinto sales_allfrom sales_fact_1997
5、,sum_promwhere sum_prom.time_id=sales_fact_1997.time_idand sum_prom.customer_id=sales_fact_1997.customer_idorder by time_id,customer_id go alter table sales_all add time_customer char(10) go update sales_all set time_customer = LTRIM( RTRIM( STR(time_id)+_+LTRIM(RTRIM( STR(customer_id) go alter table sales_all add product_name char(255) go update sales_all set product_name=product.product_name from sales_all inner join product on(sales_all.product_id=product.product_id),