收藏 分享(赏)

回归与神经网络.doc

上传人:精品资料 文档编号:11239930 上传时间:2020-02-22 格式:DOC 页数:28 大小:2.58MB
下载 相关 举报
回归与神经网络.doc_第1页
第1页 / 共28页
回归与神经网络.doc_第2页
第2页 / 共28页
回归与神经网络.doc_第3页
第3页 / 共28页
回归与神经网络.doc_第4页
第4页 / 共28页
回归与神经网络.doc_第5页
第5页 / 共28页
点击查看更多>>
资源描述

1、1回归和神经网络分析目标零售行业拥有大量消费者特征和行为数据,通过对数据进行探索挖掘得到的信息,可以帮助企业针对特定的客户进行营销,用最少的成本取得最佳的收益。分类决策树模型是一种对实例进行分类的树形结构。决策树学习算法包含特征选择、决策树的生成与剪枝过程。开始时,构建根节点,选择最优特征,该特征有几种值就分割为几个子集,每个子集分别递归调用此方法,返回节点,返回的节点就是上一层的子节点。直到数据集为空,或者数据集只有一维特征为止。logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。神经网络是一种模仿动物神经网络行为特征

2、,进行分布式并行信息处理的算法数学模型,这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。本文旨在通过建立决策树模型、逻辑回归模型、神经网络模型对企业的Organics 数据进行分析,通过划分训练集和验证集判断模型拟合优劣,最终选择最优模型来得到购买Organics的消费者的特征,从而为企业提供精准营销的客户。数据情况1.添加数据源我们发现 AGEGRP1 与 AGEGRP2 与 Age 内容相似,只是用不同形式表示年龄,因此选择拒绝这两组变量;同时,Number of Organic Products Purchased 代表购买的有机产品的数量,而

3、我们分析的目的是对消费者是否购买有机产品进行预测,因此该变量相关性较弱,可以拒绝;最后,我们将 Organics Purchased?设为目标变量进行分析。22.数据集右键探索从图中可以看到,该数据集共有 18 个变量,22223 个观测。从样本统计量中可以看到,大部分变量缺失值都比较严重, 后面应该进行相应的补缺处理。上图显示了数据集的前面 15 条数据。3从所有变量的频数统计图中可以看到,除了已经拒绝的变量,其余大部分呈现正态分布,只有变量 BILL 和 LITME 变量呈现偏态分布,因此后期数据预处理时应该对这两个变量进行转化处理。3.统计探索从目标变量的频数分布图可以看到购买人数占比大

4、概是 25%,而不购买的人数占比大概是 75%,说明我们的样本还是有意义的。数据预处理1.数据分区设置训练集比例 70%,验证集比例 30%。经过上次决策树实验得出70% Exponential; Identity; Logistic; Normal; Reciprocal; Sine; Softmax; Square; Tanh优点 决策树易于理解能够同时处理数据型和常规型属性对缺失值不敏感预测结果是界于 0和 1 之间的概率可以适用于连续性和类别性自变量自学习和自适应能力有一定的容错能力缺点 类别太多难以预测只能根据一个目标进行分类适用范围较窄对模型中自变量多重共线性较为敏感需要较长的训练

5、时间解释性差黑匣子预测能力和训练能力的矛盾问题样本依赖性问题6.模型优化模型优化主要是通过模型参数设置来起到优化效果,比如决策树中通过最大分支数、树的深度;比如回归模型中通过设置变量选择方法或者选择准则;比如神经网络中通过设置不同的激活函数以及隐藏单元数来优化模型,降低误分类率,还有很多参数设置需要我们去探索,通过不同参数设置能够得到不同的模型,最终对模型进行比较,能够得到较好结果的模型。7.结果与建议通过上述三种预测模型得出的结果,我们可以看到决策树模型结果直观简单,能够清晰的看出分类过后哪些类别的人群购买有机产品的概率有多高,但是简单的以这个标准判断较为粗矿,不能细化到每一个人,无法进行精准营销。而回归模型得到的结果能够对每个人进行判断买或者不买有机产品的概率,企业可以通过设定一定的概率阈值来寻找愿意购买有机产品的顾客,买的概率大于阈值的顾客则属于企业需要进行营销的顾客,因此这个阈值的设定也很关键,可以通过实践来得出最优阈值。神经网络模型则是个黑匣子,无法看出内在原理,只能是输入模型需要的顾客数据,直接得到顾客是否购买的结果。虽然该模型解释性较差,但是我们依然可以看到模型比较之下,神经网络模型的误分类率是最低的,相应的结果是最优的。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报