收藏 分享(赏)

如何利用Excel中进行高级数据分析.doc

上传人:精品资料 文档编号:11087482 上传时间:2020-02-06 格式:DOC 页数:13 大小:269.92KB
下载 相关 举报
如何利用Excel中进行高级数据分析.doc_第1页
第1页 / 共13页
如何利用Excel中进行高级数据分析.doc_第2页
第2页 / 共13页
如何利用Excel中进行高级数据分析.doc_第3页
第3页 / 共13页
如何利用Excel中进行高级数据分析.doc_第4页
第4页 / 共13页
如何利用Excel中进行高级数据分析.doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

1、如何利用 Excel 中进行高级数据分析(上)网站分析中专业的工具除了 Google Analytics, Adobe Sitecatalyst, Webtrends, 腾讯分析和百度统计等外,我想最常用的数据处理工具就是 Excel 了,Excel 里头最基础的就是运算和图表的制作,稍微高级一点就是函数和数据透视表的使用了,当然你可能还会想到VBA 和宏,但估计很少高手会使用这些高级的功能。那对于高级的数据分析而言,也就是涉及统计学的专业分析方法和原理的时候,是不是就一定得求助于 SPSS,SAS 这类专业的分析工具呢?数据分析从低级到高级层次的跳跃过程中有没有可以起承接作用的工具呢?其实是

2、有的,这就是 Excel 的数据分析功能。貌似最近比较火的两本 Excel 书籍谁说菜鸟不会数据分析和让 Excel 飞都没有涉及这部分的内容。高级的数据分析会涉及回归分析、方差分析和 T 检验等方法,不要看这些内容貌似跟日常工作毫无关系,其实往高处走,MBA 的课程也是包含这些内容的,所以早学晚学都得学,干脆就提前了解吧,请查看以下内容。在使用之前,首先得安装 Excel 的数据分析功能,默认情况下,Excel 是没有安装这个扩展功能的,安装如下所示:1)鼠标悬浮在 Office 按钮上,然后点击【Excel 选项】:2)找到【加载项】,在管理板块选择【Excel 加载项】,然后点击【转到】

3、:3)选择【分析工具库】,点击【确定】:4)安装完后,就可以【数据】板块看到【数据分析】功能,如下所示:安装完后,首先来了解一下回归分析的内容。一、回归分析在详细进行回归分析之前,首先要理解什么叫回归?实际上,回归这种现象最早由英国生物统计学家高尔顿在研究父母亲和子女的遗传特性时所发现的 一种有趣的现象:身高这种遗传特性表现出”高个子父母,其后代身高也高于平均身高;但不见得比其父母更高,到一定程度后会往平均身高方向发生回归” 。 这种效应被称为”趋中回归”。现在的回归分析则多半指源于高尔顿工作的那样一整套建立变量间的数量关系模型的方法和程序。 这里的自变量是父母的身高,因变量是子女的身高。百度

4、百科对于回归分析的定义是: 回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛:1)回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;2)按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。这里举个电商的例子:电子商务的转换率是一定的,网站访问数一般正比对应于销售收入,现在要建立不同访问数情况下对应销售的标准曲线,用来预测搞活动时的销售收入,如下所示:1. 首先,利用散点图描绘图形:2. 添加趋势线,并且显示回归分析的公式和 R 平方值:从图得知,R 平方值=0.9995,趋势线趋同于

5、一条直线,公式是: y=0.01028x-27.424R 平方值是介于 0 和 1 之间的数字,当趋势线的 R 平方值为 1 或者接近 1 时,趋势线最可靠。因为 R2 0.99,所以这是一个线性特征非常明显的数值,说明拟合直线能够以大于 99.99%地解释、涵盖了实际数据,具有很好的一般性, 能够起到很好的预测作用。3. 使用 Excel 的数据分析功能1)点击【数据分析】,在弹出的选择框中选择【回归】,然后点击【确定】:2)【X 值输入区域】选择访问数的单元格,【Y 值输入区域】选择销售额的单元格,同时勾选如下所示的选项,包括残差、标准残差、残差图、线性拟合图和正态概率图。3)以下内容是残

6、差和标准残差:4)以下是残差图:残差图是有关于实际值与预测值之间差距的图表,如果残差图中的散点在中轴上下两侧分布,那么拟合直线就是合理的,说明预测有时多些,有时少些,总体来说是符合趋势的,但如果都在上侧或者下侧就不行了,这样有倾向性,需要重新处理。5)以下是线性拟合图在线性拟合图中可以看到,除了实际的数据点,还有经过拟和处理的预测数据点,这些参数在以上的表格中也有显示。6)以下是正态概率图正态概率图一般用于检查一组数据是否服从正态分布,是实际数值和正态分布数据之间的函数关系散点图,如果这组数值服从正态分布,正态概率图将是一条直线。回归分析不一定得符合正态分布,这里只是仅仅把它描绘出来而已。以上

7、数据表格和图表都说明公式 y=0.01028x-27.424 是一个值得信赖的预测曲线,假设搞活动时流量有 50 万访问数的话,那么预测销售将是 51373,如下图所示:如何利用 Excel 中进行高级数据分析(下) 风格 2013-07-22 11:20:35 干货教程 / 数据分析 评论(0)上篇博文已经介绍了如何安装 Excel 的高级数据分析功能,并且介绍了回归分析,说实话篇幅有点长,主要是安装那块截图比较多;这篇主要介绍一下描述统计、抽样分析和直方图。 一、描述统计 中位数、众数、数据分布区间可能还比较容易可以算出,但是标准差和方差等的计算就比较麻烦了,这些都是描述样

8、本数据的常用变量,使用 Excel 数据分析中的”描述统计”可以得到这些数据。 举个例子:根据过去 15 天的电子商务转化率,想要得到它的数据分布区间、标准差、峰值和极差等描述统计指标。一般来说,电子商务网站的转换率在 3%以下,转换率指的是订单除以访问数,注意不是除以 pv,因为对于某些外贸站,访问深度可能比较深,每即次访问可能有10 的 pv,所以用 pv 来做电子商务的转换率不合适。 数据源如下所示:按照以下图例进行设置:设置后,会得到如下所示的图表:(解释是我人为添加的,是对指标的解释)二、抽样分析 抽样分析工具以数据源区域为总体,从而为数据源创建一个样本。当总体太大而不能进行处理或绘制时,可以选用具有代表性的样本。 举个例子: 假设这样一种情况,要抽查电子商务转换率的情况是否正常。 数据源如下所示:按照以下图例进行设置,注意是抽 8 个样本:设置后,会得到如下所示的图表:三、直方图 直方图是最适合描述数据在不同选定区间分布情况的图表。 数据源如下所示:按照以下图例进行设置:设置后,会得到数据和图表:这样估计就很清晰的可以看出数据在哪个区间分布最广了。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报