1、1,回归分析及相关性分析,2,教师信息,教师:张晓黎 电子信箱: 办公室:学院楼B420 电话: 67703854,3,上周回顾,净现值和内部收益率的概念、相关函数和决策准则 投资过程的现金时间流分析,4,学习目标,通过案例分析,引入回归分析、相关性分析等统计学概念和理论知识,基本掌握运用Excel工具解决数据处理与分析等商务决策的方法。 掌握回归分析理论及模型建立的方法 理解拟合度等相关参数的意义 掌握相关性分析理论及模型建立的方法 理解相关系数等参数的经济意义,5,回归分析,回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。 回归分析按照涉及的自变量的多少,可分为一
2、元回归分析和多元回归分析 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析,6,简单回归分析,回归基本上可视为一种拟合过程,即用最恰当的数学方程去拟合一组由一个因变量和一个或多个自变量所组成的原始数据。 最简单的形式是线性回归,它有一个因变量和一个自变量,因此就是用一个线性方程y=a+bx去拟合一系列对变量x和y的数据观察值的过程。,7,简单回归分析示例,示例1:已知一种新牌子化肥的不同施用量对庄稼产量的影响如下表。请你确定当化肥施用量为5.5克时估计预期的产量。,8,利用Excel建立线性回归模型,根据数据建立散点图 自变量放在X轴,因变量放在Y轴 简单线性拟合 添加趋势
3、线(类型为“线性”),选定“显示公式”和“显示R2值” 得到趋势线(线性)方程和R2 将X代入方程 X=5.5,Y=0.4701,9,如何衡量直线拟合的程度,如果每一个观察点都落在拟合方程上,那么就会得到一个满分1(100%)。 拟合方程对观察到的原始数据拟合得怎么样? 随着越来越多的观察点偏离拟合直线,分数就会下降,这个分数就叫做R2 ,R2 = 0.5983=59.83%60%,说明方程拟合得不够好,我们从趋势线可以直观地看到此关系不是线性的。,10,二次方程拟合,重新添加趋势线(类型为多项式) 结果很明显,拟合程度从线性方程的60%提高到二次方程的97%。 反映出观察到的饱和程度。,11
4、,最大利润模型思考,示例2:假设庄稼以每公斤4元的价格出售,化肥要以每克0.2元的价格购买。请确定能产生最大利润的化肥施用量。(运用规划求解) 总收益=价格产量=4元(-0.0066X2+0.0897x+0.2419) 总成本=化肥成本化肥施用量=0.2X,12,利用Excel回归路径数据分析,步骤: 加载宏分析工具库 工具数据分析回归 在“回归”对话框输入X值和Y值的区域 选择“标志” 确定输出区域,13,数据分析结果,14,多元回归,示例3:假设某种商品的销售量与价格、广告支出、家庭收入有关。 现有35个地区市场的相关数据。 用价格、广告支出和家庭收入对销售量建立一个多元回归模型。 销售量
5、=624.32-40.73*价格+7.10*广告支出+0.50*家庭支出,15,相关性分析,相关性分析是检验衡量两变量关联强度的过程 在统计研究中,常涉及到两个事物(变量)的相互关系问题,例如,学习成绩与非智力因素的关系,数学成绩与物理成绩的关系,男女生学习成绩的关系,等等。其关系表现为以下三种变化; 第一,正相关:一个变量增加或减少时,另一个变量也相应增加或减少; 第二,负相关:一个变量增加或减少时,另一个变量却减少或增加; 第三,无相关:说明两个变量是独立的,即由一个变量值,无法预测另一个变量值。 统计学中,就用“相关系数“来从数量上描述两个变量之间的相关程度,用符号“r“来表示。,16,
6、皮尔森积矩相关系数,Pearson product-moment correlation coefficient,17,相关系数表示的意义,相关系数r是对两变量线性相关的测量,数值的范围从-1到0,到+1,表达变量间的相关强度。 r值为+1表示两组数完全正相关 r值为-1表示两组数完全负相关,说明它们间存在反向关系,一个变量变大时另外一个就变小 当r值为0时表示两变量之间不存在线性关系 相关系数取值范围限于:r,18,利用Excel计算相关系数,Excel中计算相关系数有两种方法 Excel数据分析功能 CORREL()函数,19,利用Excel数据分析计算相关系数,示例4:一般认为联邦债券利
7、率与商品期货指数相关。下表列出了12天里的联邦债券利率与商品期货指数,用这些数据计算相关系数r。,20,利用CORREL()函数计算相关系数,CORREL()函数 =CORREL(Array1,Array2) array1和 array2为需要确定相关性的两组数据 利用CORREL()函数可以求出联邦债券利率与商品期货指数之间的相关系数,21,回归分析与相关关系的区别,相关关系不表明因果关系,是双向对称的,在相关分析中,对所讨论的两个变量或多个变量是平等对待的,相关系数r反映数据(xi,yi)所描述的散点对直线的靠拢程度。 回归分析中,变量在研究中地位不同,要求因变量(响应变量)y是随机变量,自变量一般是可控制的普通变量(当然也可以是随机的)。在回归方程中,回归系数只反映回归直线的陡度,且它不是双向对称的。,22,课堂练习,示例1-4,23,课后练习,P200 作业1-4 作业7,9-11,24,思考题,P206 思考题1 案例1601,25,下次课内容,人事档案管理及统计,