计量经济学重点知识整理.doc-道客多多

资源描述

1、计量经济学重点知识整理1 一般性定义计量经济学是以经济理论和经济数据的事实为依据，运用数学和统计学的方法，通过建立数学模型来研究经济数量关系和规律的一门经济学科。研究的主体（出发点、归宿、核心）：经济现象及数量变化规律研究的工具（手段）：模型数学和统计方法必须明确：方法手段要服从研究对象的本质特征（与数学不同）,方法是为经济问题服务2 注意：计量经济研究的三个方面理论：即说明所研究对象经济行为的经济理论计量经济研究的基础数据：对所研究对象经济行为观测所得到的信息计量经济研究的原料或依据方法：模型的方法与估计、检验、分析的方法计量经济研究的工具与手段三者缺一不可 3 计量经济学的学科类型理

2、论计量经济学研究经济计量的理论和方法应用计量经济学：应用计量经济方法研究某些领域的具体经济问题4 区别：经济理论重在定性分析,并不对经济关系提供数量上的具体度量计量经济学对经济关系要作出定量的估计，对经济理论提出经验的内容5 计量经济学与经济统计学的关系联系：经济统计侧重于对社会经济现象的描述性计量经济统计提供的数据是计量经济学据以估计参数、验证经济理论的基本依据经济现象不能作实验，只能被动地观测客观经济现象变动的既成事实，只能依赖于经济统计数据6 计量经济学与数理统计学的关系联系：数理统计学是计量经济学的方法论基础区别：数理统计学是在标准假定条件下抽象地研究一般的随机变量的统计规律性；计量经

3、济学是从经济模型出发，研究模型参数的估计和推断，参数有特定的经济意义，标准假定条件经常不能满足，需要建立一些专门的经济计量方法3、计量经济学的特点：计量经济学的一个重要特点是：它自身并没有固定的经济理论，而是根据其它经济理论，应用计量经济方法将这些理论数量化。4、计量经济学为什么是一门单独的学科计量经济学是经济理论、数理经济、经济统计与数理统计的混合物。1、经济理论所作的陈述或假说大多数是定性性质的，计量经济学对大多数经济理论赋予经验内容。2、经济统计学的问题主要是收集、加工并通过图或表的形式以展现经济数据，他们不考虑怎样用所收集的数据来检验经济理论。3、虽然数理统计学提供了这一行业中使用的许

4、多工具，但由于大多数经济数据的独特性，计量经济学家常常需要有特殊的方法。2、计量经济学的方法论1、用计量经济学来分析问题的一般方法;（1）理论或假说的陈述（2）理论的数学模型的设定（3）理论的计量模型的设定（4）获取数据（5）计量经济模型的参数估计（6）模型检验（假设检验）（7）模型的应用：A、预报或预测 B、利用模型进行控制或制定政策2、应用举例（消费函数）：（1）理论或假说的陈述：凯恩斯认为：随着收入的增加，消费也会增加，但是消费的增加不及收入增加的多。即边际消费倾向递减。（2）理论的数学模型设定： Y = a + bX其中 y 为消费支出， x 为收入，为模型的参数，分别代表截距和斜率系

5、数。斜率系数就是消费边际倾向 MPC 的度量。其中左边的 Y 称为应变量，方程右边的 X 称为自变量或解释变量。该方程表明消费和收入之间存在准确的一一对应关系。（3）计量模型的设定：考虑到经济变量间的非准确关系，则消费函数的计量模型可以设定为: Y = a + Bx + 其中被称为干扰项，或误差项，是一个随机变量，它有良好定义的概率性质。是从模型中省略下来的而又集体影响着 Y 的全部变量的替代物（就是除了收入外，其它可能影响消费的所有因素）。（4）数据的获得各种统计年鉴，企业报表和相关职能部门公布的统计数据。（该例中我们可以通过中国统计年鉴获取相关数据）（5）参数估计（利用各种统

6、计或计量软件来进行如：Eviews）以美国 1980-1991 年的数据，通过 Eviews5.0 的计算，我们可得如下消费函数方程： -231.8 + 0.7196其中-231.8 0.7196它表明在 1980-1991 年间，实际收入每增加一元，美国人的平均消费增加 0.72 元。（6）模型检验（假设检验）A、对理论或假说的检验弗里德曼认为凡是不能通过经验数据检验（实证检验）的理论或假设，都不能作为科学探索的一部分。0 0.71961B、对模型的检验统计推断检验：模型的拟合优度检验、变量的显著性检验计量经济学检验：平稳性、多重共线性、自相关、异方差等方面的检验、（7）预报或预测（8）利

7、用模型进行控制或制定政策4.计量经济学模型的应用一、结构分析经济学中的结构分析是对经济现象中变量之间相互关系的研究。结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。计量经济学模型的功能是揭示经济现象中变量之间的相互关系，即通过模型得到弹性、乘数等。应用举例二、经济预测计量经济学模型作为一类经济数学模型，是从用于经济预测，特别是短期预测而发展起来的。计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技术手段。对于非稳定发展的经济过程，对于缺乏规范行为理论的经济活动，计量经济学模型预测功能失效。模型理论方法的发展以适应预测的需要。三、政策评价政策评价的重要

8、性。经济政策的不可试验性。计量经济学模型的“经济政策实验室”功能。四、理论检验与发展实践是检验真理的唯一标准。任何经济学理论，只有当它成功地解释了过去，才能为人们所接受。计量经济学模型提供了一种检验经济理论的好方法。对理论假设的检验可以发现和发展理论。 3 变量数据参数与模型1、计量经济模型中的变量（1）从变量的因果关系分：自变量因（应）变量解释变量被解释变量（2）从变量的性质分内生变量：模型求解的结果外生变量：2、计量经济学中应用的数据（1）时间序列数据（2）截面数据（3）混合数据（4）虚拟变量数据：一些定性的事实，不能直接用一般的数据去计量。3、参数及其估计准则（1）无偏性

9、（2）最小方差性（最优无偏估计）（3）一致性4、计量模型的基本函数形式（1）线性模型（2）非线性模型（可变为线性形式的非线性模型）双对数模型半对数模型倒数变换模型第二章一元回归模型概述回归分析的性质回归分析的一些基本概念对线性的几点说明2.1 回归分析的性质一、变量间的关系及回归分析的基本概念1、变量间的关系经济变量之间的关系，大体可分为两类：（1）确定性关系或函数关系：研究的是确定现象非随机变量间的关系。（2）统计依赖或相关关系：研究的是非确定现象随机变量间的关系。（以一定的统计规律呈现出来的关系）例如：函数关系：统计依赖关系/统计相关关系：正相关线性相关不相关相

10、关系数：统计依赖关系负相关 1XY 有因果关系回归分析正相关无因果关系相关分析非线性相关不相关负相关注意：不线性相关并不意味着不相关；有相关关系并不意味着一定有因果关系；回归分析/相关分析研究一个变量对另一个（些）变量的统计依赖关系，但它们并不意味着一定有因果关系。相关分析对称地对待任何（两个）变量，两个变量都被看作是随机的。回归分析对变量的处理方法存在不对称性，即区分应变量（被解释变量）和自变量（解释变量）：前者是随机变量，后者不是。回归与因果关系虽然回归分析研究一个变量对另一（些）变量的依赖关系，但它并不意味着

11、因果关系。Kendall 和 Stuart 认为一个统计关系式不管多么强，也不管多么有启发性，却永远不能确立因果方面的联系，对因果关系方面的理念必须来自统计学之外，最终来自这种或那种理论。从逻辑上说，统计关系式本身不可能意味着任何因果关系。要谈因果关系，必须诉诸先2,半径半径圆面积 f施肥量阳光降雨量气温农作物产量 ,f验或理论上的思考。2.2 回归分析的基本思想：一、利用样本来推断总体1、总回归函数（PRF）2、样本回归函数（SRF）3、样本回归函数对总回归函数的进行拟合：（1）最小二乘法（OLS）（2）最小二乘法的基本假定（3）最小二乘估计的精度或标准误（4）最

12、小二乘估计量的性质（5）拟合优度的度量（6）区间估计或假设检验4、利用回归方程进行分析、评价及预测。二、回归分析的基本概念1、回归分析(regression analysis)是研究一个变量关于另一个（些）变量的具体依赖关系的计算方法和理论。其用意：在于通过后者的已知或设定值，去估计和（或）预测前者的（总体）均值。这里：前一个变量被称为被解释变量或因变量对变量测量尺度的注解：分类尺度（名义尺度）、顺序尺度（序数尺度）、间隔尺度（区间尺度）、比率尺度（比率尺度）三、总体回归函数由于变量间关系的随机性，回归分析关心的是根据解释变量的已知或给定值，考察被解释变量的总体均值，即当解释变量取某

13、个确定值时，与之统计相关的被解释变量所有可能出现的对应值的平均值。例 2.1：一个假想的社区有 100 户家庭组成，要研究该社区每月家庭消费支出 Y 与每月家庭可支配收入 X 的关系。即如果知道了家庭的月收入，能否预测该社区家庭的平均月消费支出水平。为达到此目的，将该 100 户家庭划分为组内收入差不多的 10 组，以分析每一收入组的家庭消费支出。分析：（1）由于不确定因素的影响，对同一收入水平 X，不同家庭的消费支出不完全相同；（2）但由于调查的完备性，给定收入水平 X 的消费支出 Y 的分布是确定的，即以 X 的给定值为条件的 Y 的条件分布（ Conditional distributi

14、on）是已知的，如： P(Y=561|X=800）=1/4 。因此，给定收入 X 的值 Xi，可得消费支出 Y 的条件均值（ conditional mean）或条件期望（conditional expectation）： E(Y|X=Xi)该例中：E(Y | X=800)=561描出散点图发现：随着收入的增加，消费“平均地说”也在增加，且 Y 的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。05001000150020002500300035005001000 1500 2000 2500 3000 3500 4000每月可支配收入X（元）每月消费支出Y（元）概念：在给定解释变

15、量 Xi 条件下被解释变量 Yi 的期望轨迹称为总体回归线，或更一般地称为总体回归曲线。相应的函数： )(|(iifYE称为（双变量）总体回归函数。含义：回归函数（PRF）说明被解释变量 Y 的平均状态（总体条件期望）随解释变量 X 变化的规律。函数形式：可以是线性或非线性的。例 2.1 中，将居民消费支出看成是其可支配收入的线性函数时: iiYE10)|(为一线性函数。其中， 0， 1 是未知参数，称为回归系数（regression coefficients ）。。四、随机扰动项总体回归函数说明在给定的收入水平 Xi 下，该社区家庭平均的消费支出水平。但对某一个别的家庭，其消费支出可能与

16、该平均水平有偏差。记： )|(iii XYE称 i 为观察值 Yi 围绕它的期望值 E(Y|Xi)的离，是一个不可观测的随机变量，又称为随机干扰项或随机误差项。例 2.1 中，个别家庭的消费支出为：（*）即，给定收入水平 Xi ,个别家庭的支出可表示为两部分之和:（1）该收入水平下所有家庭的平均消费支出 E(Y|Xi)，称为系统性（ systematic）或确定性（deterministic) 部分。（2）其他随机或非确定性（nonsystematic)部分i 。(*)式称为总体回归函数 PRF 的随机设定形式。表明被解释变量除了受解释变量的系统性影响外，还受其他因素的随机性影响。由于方程中

17、引入了随机项，成为计量经济学模型，因此也称为总体回归模型。随机误差项主要包括下列因素的影响：随机误差项是指从模型中省略下来的而又集体地影响着 Y 的全部变量的替代物。1）在解释变量中被忽略的因素的影响；2）变量观测值的观测误差的影响；3）其它随机因素的影响。产生并设计随机误差项的主要原因：1）理论的含糊性； 2）数据的欠缺（糟糕的替代变量） 3）核心变量与周边变量； 4）节省原则；5）人类行为的内在随机性；6）错误的函数形式；35 五、样本回归函数（SRF）问题：能从一次抽样中获得总体的近似的信息吗？如果可以，如何从抽样中获得总体的近似信息？例 2.2：在例 2.1 的总体中有如下一个样本，

18、总体的信息往往无法掌握，现实的情况只能是在一次观测中得到总体的一个样本。问：能否从该样本估计总体回归函数 PRF？回答：能表 2.1.3 家庭消费支出与可支配收入的一个随机样本 Y 80 10 140 170 200 230 260 290 320 350 X 594 638 12 15 1408 1595 1969 2078 2585 2530 核样本的散点图（scatter diagram)：样本散点图近似于一条直线，画一条直线以尽好地拟合该散点图，由于样本取自总体，可以该线近似地代表总体回归线。该线称为样本回归线。记样本回归线的函数形式为： iii

19、XXfY10)(称为样本回归函数。注意：这里将样本回归线看成总体回归线的近似替代则样本回归函数的随机形式/样本回归模型：同样地，样本回归函数也有如下的随机形式： iiiii eXY10式中， ie称为（样本）残差（或剩余）项（ residual），代表了其他影响 Y的随机因素的集合，可看成是的估计量 i。由于方程中引入了随机项，成为计量经济模型，因此也称为样本回归模型。回归分析的主要目的：根据样本回归函数 SRF，估计总体回归函数 PRF。即，根据 iiiii eXe10估计 iiiiiXYE)|(注意：这里 P

20、RF 可能永远无法知道。2.3 对线性的几点说明一、对变量之间关系为线性二、对参数为线性三、本身为非线性，但通过变形可以变为线性关系经典回归分析主要考虑对参数是线性的形式，对变量之间的关系不作线性要求。第三章一元回归模型的参数估计一、参数的普通最小二乘估计（OLS）二、最小二乘估计量的数值性质三、一元线性回归模型的基本假设四、最小二乘估计量的统计性质五、参数估计量的概率分布及随机干扰项方差的估计六、最小二乘估计（OLS）的精度或标准误单方程计量经济学模型分为两大类：线性模型和非线性模型线性模型中，变量之间的关系呈线性关系非线性模型中，变量之间的关系呈非线性关系一元线性回归模型：只有一个解

21、释变量 iiiXY10i=1,2,nY 为被解释变量，X 为解释变量， 0 与 1 为待估参数，为随机干扰项回归分析的主要目的是要通过样本回归函数（模型）SRF 尽可能准确地估计总体回归函数（模型）PRF。估计方法有多种，其中最广泛使用的是普通最小二乘法。因为 OLS 具有良好的数值性质和统计性质。同时，在一系列假定下 OLS 估计量具有 BLUE 性质，能满足我们用样本推断总体的要求。注：实际这些假设与所采用的估计方法紧密相关。一、参数的普通最小二乘估计（OLS）给定一组样本观测值（Xi, Yi）（i=1,2,n）要求样本回归函数尽可能好地拟合这组值.离差要求样本函数仅可能好的拟合这

22、组数值，我们可以考虑使观测值 Yi 与样本回归值之差(残差 ei)尽可能的小，使之尽可能的接近 PRF,即：注：在统计分析中，如没有特殊说明，离差一般是指观测值与其均值的差，即 )(minYii这种方法尽管有直观上的说服力，却不是一个很好的准则，如果采用即 minei那么在总和（e1+e2+e3+e4+ei )中，无论残差离样本回归函数 SRF 远还是近，都得到同样的权重。结果很可能 ei 离开 SRF散布得很远，但代数和很小甚至为零。普通最小二乘法给出的判断标准是：二者之差的平方和 niiinXYQ121021)()(最小。为什么要用两者之差平方和最小：1、它根据各观测值离 SRF 的远近不

23、同分别给予不同的权重。从而 ei 越大，ei2 也越大。2、 ei2f(0 , 1 )，即残差平方和是估计量 0 ,1 的某个函数。 3、用 OLS 原理或方法选出来的 0 ,1，将使得对于给定的样本或数据残差平方和尽可能的小。方程组（*）称为正规方程组（normal equations）。记 2221)(iiii XnXx上述参数估计量可以写成： Yxyi102称为 OLS 估计量的离差形式由于参数的估计结果是通过最小二乘法得到的，故称为普通最小二乘估计量。二、OLS 估计量的数值性质 OLS 数值性质是指运用最小二乘法而得以成立的那些性质，而不管这些数据是怎样产生的。1、OLS 估计

24、量纯粹是用可观测的量（即样本）来表达的，因此这些量是容易计算的。2、这些量是点估计量。3、一旦从样本数据得到 OLS 估计值，便容易画出样本回归线，这样得到的回归线有如下性质：（1）它通过 Y 和 X 的样本均值。即（2）估计的 Y 均值等于实测的 Y 均值。即（3）残差 ei 的均值为零。即ei=0。据此，我们可以推出样本回归函数的离差形式。即 iixy1注意：在计量经济学中，往往以小写字母表示对均值的离差。 (minYiiiYy X10Y记 Yyi则有 inii eX1100)()(可得 iixy（*）（*）式为样本回归函数的离差形式。（4）残差 ei 和预测的 Yi 值不相关。即（5）残

25、差 ei 和 Xi 不相关。即 eiXi=0三、线性回归模型的基本假设为什么要做出假定：1、虽然通过 OLS，我们可以获得 , 的估计值，但我们的目的不仅仅是为了得到它们的值。2、更为重要的是对 0 , 1 与真实的 0 , 1 之间的替代性进行推断。3、对 Yi 与 E(Y|X=Xi)之间的差距到底有多大进行推断。4、在模型 iii eXY10 中， ei 是一随机变量，如果我们不知道 xi、ei 是怎样产生的，就无法对 Yi 做出任何推断，也无法对 0 , 1 做出任何推断。5、在一系列假定下，OLS 具有良好的统计性质，能够满足我们对 0 , 1 作出推断的要求。线性回归模型的基本假设假

26、设 1、线性回归模型，回归模型对参数而言是线性的；假设 2、解释变量 X 是确定性变量，不是随机变量；假设 3、随机误差项具有零均值、同方差和不序列相关性：E(i)=0 i=1,2, ,nVar(i)=2 i=1,2, ,nCov(i, j)=0 ij i,j= 1,2, ,n假设 4、随机误差项与解释变量 X 之间不相关：Cov(Xi, i)=0 i=1,2, ,n假设 5、服从零均值、同方差、零协方差的正态分布iN(0, 2 ) i=1,2, ,n假设 6、观测次数 n 必须大于待估的参数个数；假设 7、X 值要有变异性；假设 8、正确的设定了回归模型；也被称为模型没有设定偏误（s

27、pecification error）；假设 9、在多元回归模型中没有完全的多重共线性。注意：1、如果假设 2、3 满足，则假设 4 也满足;2、如果假设 5 满足，则假设 3 也满足。以上假设也称为线性回归模型的经典假设或高斯（Gauss ）假设，满足该假设的线性回归模型，也称为经典线性回归模型。另外，在进行模型回归时，还有一个暗含的假设： 0)(iYe假设 10：随着样本容量的无限增加，解释变量 X 的样本方差趋于一有限常数。即nQXi,/)(2假设 5 旨在排除时间序列数据出现持续上升或下降的变量作为解释变量，因为这类数据不仅使大样本统计推断变得无效，而且往往产生所谓的伪回归问题。

28、四、假定条件下的最小二乘估计量的统计性质当模型参数估计出后，需考虑参数估计值的精度，即是否能代表总体参数的真值，或者说需考察参数估计量的统计性质。一个用于考察总体的估计量，可从如下几个方面考察其优劣性：（1）线性性，即它是否是另一随机变量的线性函数；（2）无偏性，即它的均值或期望值是否等于总体的真实值；（3）有效性，即它是否在所有线性无偏估计量中具有最小方差。（4）渐近无偏性，即样本容量趋于无穷大时，是否它的均值序列趋于总体真值；（5）一致性，即样本容量趋于无穷大时，它是否依概率收敛于总体的真值；（6）渐近有效性，即样本容量趋于无穷大时，是否它在所有的一致估计量中具有最小的渐近方差。这三个准则

29、也称作估计量的小样本性质。拥有这类性质的估计量称为最佳线性无偏估计量（best liner unbiased estimator, BLUE）。当不满足小样本性质时，需进一步考察估计量的大样本或渐近性质：高斯马尔可夫定理在给定经典线性回归的假定下，最小二乘估计量是具有最小方差的线性无偏估计量。证2、无偏性，即估计量 0、 1的均值（期望）等于总体回归参数真值 0与 1 证： iiiiii kXkY10)(易知2iixi故 ik1 11)()() iiEkE同样地，容易得出 22)(1iiii xYxy000 )()() ii EwE （2）证明最

30、小方差性假设 *1是其他估计方法得到的关于 1的线性无偏估计量： iYc*其中，ci=ki+di ，di 为不全为零的常数则容易证明 )var(1*1普通最小二乘估计量称为最佳线性无偏估计量由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性，它自然也拥有大样本特性。)/lim()li(li)li(21 21nxPxPki ii1110),QXCov五、参数估计量的概率分布及随机干扰项方差的估计 2、随机误差项的方差 2 的估计由于随机项 i 不可观测，只能从 i 的估计残差 ei 出发，对总体方差进行估计。 2 又称为总体方差。可以证明，2

31、的最小二乘估计量为 2nei它是关于 2 的无偏估计量。第四章一元线性回归模型的统计检验一、拟合优度检验二、变量的显著性检验三、参数的置信区间回归分析是要通过样本所估计的参数来代替总体的真实参数，或者说是用样本回归线代替总体回归线。尽管从统计性质上已知，如果有足够多的重复抽样，参数的估计值的期望（均值）就等于其总体的参数真值，但在一次抽样中，估计值不一定就等于该真值。那么，在一次抽样中，参数的估计值与真值的差异有多大，是否显著，这就需要进一步进行统计检验。主要包括拟合优度检验、变量的显著性检验及参数的区间估计。一、拟合优度检验拟合优度检验：对样本回归直线与样本观测值之间拟合程度的

32、检验。度量拟合优度的指标：判定系数（可决系数）r2（二元回归）或 R2（多元回归）问题：采用普通最小二乘估计方法，已经保证了模型最好地拟合了样本观测值，为什么还要检验拟合程度？1、总离差平方和的分解已知由一组样本观测值（Xi,Yi），i=1,2,n 得到如下样本回归直线如果 Yi=i 即实际观测值落在样本回归“线”上，则拟合最好。可认为， “离差”全部来自回归线，而与“残差”无关。对于所有样本点，则需考虑这些点与样本均值离差的平方和。我们可以得到：方程两边同时平方，求和得：TSS=ESS+RSSY 的观测值围绕其均值的总离差 (total varia 可分解为两部分：一部分来自回归线(ES

33、S)，另一部分则来自随机势力(RSS)。在给定样本中，TSS 不变，如果实际观测点离样本回归线越近，则 ESS 在 TSS 中占的比重越大，因此,拟合优度：回归平方和 ESS/Y 的总离差 TSS2、可决系数 R2 统计量称 R2 为（样本）可决系数/判定系数（coefficient of determination) 。可决系数的取值范围：0，1R2 越接近 1，说明实际观测点离样本线越近，拟合优度越高。二、回归系数的区间估计如果存在这样一个区间，称之为置信区间; 1- 称为置信系数（置信度），称为显著性水平；置信区间的端点称为置信限或临界值。从定义我们可以看出，区间估计量是一个构造

34、出来的区间，要使得它把参数的真值包括在区间的界限内有一个特定的概率：1在给定 0.05 或 5%的情况下 ,置信( 随机)区间包含真实的概率为 0.95 或 95%。它表示使用我们所描述的方法构造出来的众多区间中包含真值的概率为 0.95 或 95%。我们能不能构造出这样的区间呢？依据什么来构造呢？依据概率知识我们知道，如果估计量的抽样或概率分布已知，我们就可以构造出以一定概率包含真实值的区间。对回归系数的区间估计可归纳为三种情况0.05，即 1 0.950.01，即 1 0.990.001，即 1 0.999例如：取 0.05，即 1 0.95，查标准正态分布表可知Z 值在（1

35、.96，1.96）区间的概率为 0.95。即 P（1.96Z1.96）0.95三、假设检验：回归分析是要判断解释变量 X 是否是被解释变量 Y 的一个显著性的影响因素。在一元线性模型中，就是要判断 X 是否对 Y 具有显著的线性性影响。这就需要进行变量的显著性检验。变量的显著性检验所应用的方法是数理统计学中的假设检验。计量经计学中，主要是针对变量的参数真值是否为零来进行显著性检验的。 1、假设检验所谓假设检验，就是事先对总体参数或总体分布形式作出一个假设，然后利用样本信息来判断原假设是否合理，即判断样本信息与原假设是否有显著差异，从而决定是否接受或否定原假设。当我们拒绝原假设（虚拟假设）时，

36、我们说发现统计上是显著的。当我们不拒绝原假设时，我们说发现不是统计上显著的。假设检验采用的逻辑推理方法是反证法。先假定原假设正确，然后根据样本信息，观察由此假设而导致的结果是否合理，从而判断是否接受原假设。判断结果合理与否，是基于“小概率事件不易发生”这一原理的2、变量的显著性检验检验步骤：（1）对总体参数提出假设H0： 1=0， H1：10（2）以原假设 H0 构造 t 统计量，并由样本计算其值（3）给定显著性水平，查 t 分布表，得临界值 t /2(n-2)(4) 比较，判断若 |t| t /2(n-2)，则拒绝 H0 ，接受 H1 ；若 |t| t /2(n-2)，则拒绝 H1 ，接受

37、 H0 ；)(11Sett 统计量的计算结果分别为：给定显著性水平 =0.05，查 t 分布表得临界值 t 0.05/2(8)=2.306|t1|2.306，说明家庭可支配收入在 95%的置信度下显著，即是消费支出的主要解释变量；|t2|2.306,表明在 95%的置信度下，无法拒绝截距项为零的假设。 3、变量的置信区间检验要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值，往往需要通过构造一个以样本参数的估计值为中心的“区间” ，来考察它以多大的可能性（概率）包含着真实的参数值。这种方法就是参数检验的置信区间估计。在置信区间检验程序中，我们试图建立一个以某种概率包含有真实

38、，但未知的的一个范围区间；而在显著性检验步骤中，我们假设为某值，然后看所计算的值,是否位于该假设值周围某个合理的范围内。由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度，因此置信区间越小越好。要缩小置信区间，需（1）增大样本容量 n，因为在同样的置信水平下，n 越大，t 分布表中的临界值越小；同时，增大样本容量，还可使样本参数估计量的标准差减小；（2）提高模型的拟合优度，因为样本参数估计量的标准差与残差平方和呈正比，模型拟合优度越高，残差平方和应越小。第六章双变量线性回归模型的延伸6.1 过原点的回归过原点的回归例 1: 资本资产定价模型 (CAPM) 证券期望风

39、险溢价=期望市场风险溢价例尺度和单位变化的影响 i, SEE, RSS 的值会受到影响6.3 回归模型的函数形式对数线性模型半对数模型倒数模型 6.7 函数形式的选择模型背后的理论求出回归子对回归元的斜率和弹性系数应满足一些先验预期有时不止一个模型能很好的拟合给定数据集不应该过分强调 R2。6.8 相加性和相乘性误差无论是何种设定的模型，只要是关于参数的线性模型，均可以运用 OLS 进行估计，但对于残差而言，只能对便携式计的残差进行诊断其是否为正态，而不是直接对原始扰动进行检验。第七章多元回归分析估计问题7.1三变量模型将双变量总体回归模型(PRF)推广为 3 变量, 即 b1 为截距项,

40、按模型的设定可机械地解释为当 X1,X2 为 0 时,Y 的均值, 隐含的意义为没有包含在模型中的变量对 Y 的部分影响 ,系数 b2 和 b3 则称为偏回归系数。误差项的假定7.2 多元回归方程的解释方程表示，在给定回归变量的固定值时，被解释变量的条件期望即总体回归函数。 b2 代表了在 X3 不变的情况下， X2 每变化一个单位时， Y 的条件均值变化。 b3 代表了在 X2 不变的情况下， X3 每变化一个单位时， Y 的条件均值变化。 7.6 例子：婴儿死亡率与人均 GDP 和女性识字率的关系定义变量：Yi 表示婴儿死亡率(5 岁以下,千分数),X2i 表示人均 GDP, X3i 表

41、示女性识字率(%),为研究这 3 个变量之间的关系,设定模型为Yi =b1+ b2X2i+ b3X3i+ui 人均 GDP,应有 b20, b30. 估计结果 Yi =263.64-0.0056X2i-2.232X3i 7.7 . 设定误差初探所谓设定误差，是根据经济学理论，对某个变量(应变量)的行为(或某种理论)应使用多个（如 2 个）变量予以解释，但研究者却使用较少的变量（如一个）对此变量进行解释,显然反之亦产生设定错误，由此而产生设定错误，称为设定误差. 7.9. 偏相关系数对于 3 变量回归模型我们已定义 Y 与 X2 的相关 r12 称为简单相关，其中上标 1 表示应变量，下标表示对

42、应的解释变量。第八章多元回归分析:推断问题8.1 再一次正态性假定对于模型 Yib1+b1X2i+b3X3i+ui 对 ui 的分布作出假定,由于中心极限定理 ,ui 假设为独立正态分布。在这一假定之下 ,偏回归系数的 OLS 估计量仍是 BLUE,且等同于 ML 估计进一步,偏回归系数也为正态分布, 由此,可类似二变量模型构造显著性检验统计量（如统计量）进行假设检验。 8.3 多元回归中的假设检验个别偏回归系数的假设检验模型的总体显著性检验检验某 2 或多个系数之间的关系，如是否相等，或其它线性或非线性关系，称为约束条件；检验所估计的模型在时间或不同的横截面上是否具有稳定性检验回归

43、模型的函数形式 8.5 检验样本回归的总显著性小结：多元线性回归模型的统计检验一、拟合优度检验二、方程的显著性检验(F 检验) 三、变量的显著性检验（t 检验）四、参数的置信区间一、拟合优度检验1、可决系数与调整的可决系数总离差平方和的分解则 222)()()( YYTSiiiii 可决系数 TSRE12该统计量越接近于 1，模型的拟合优度越高。问题：在应用过程中发现，如果在模型中增加一个解释变量， R2 往往增大（Why?)这就给人一个错觉：要使得模型拟合得好，只要增加解释变量即可。但是，现实情况往往是，由增加解释变量个数引起的 R2 的增大与拟合好坏无关，R2需调整。调整的可决系数

44、在样本容量一定的情况下，增加解释变量必定使得自由度减少，所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度，以剔除变量个数对拟合优度的影响: )1/(2nTSkR其中：n-k-1 为残差平方和的自由度， n-1 为总体平方和的自由度。二、方程的显著性检验(F 检验) 方程的显著性检验，旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。1、方程显著性的 F 检验即检验模型 Yi=0+1X1i+2X2i+kXki+i i=1,2, ,n 中的参数 j 是否显著不为0。可提出如下原假设与备择假设： H0： 0=1=2= =k=0H1： j 不全为 0F 检验

45、的思想来自于总离差平方和的分解式：TSS=ESS+RSS由于回归平方和 2iyES是解释变量 X的联合体对被解释变量 Y的线性作用的结果，考虑比值/iieR如果这个比值较大，则 X 的联合体对 Y 的解释程度高，可认为总体存在线性关系，反之总体上可能不存在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。根据数理统计学中的知识，在原假设 H0 成立的条件下，统计量 )1/(knRSEF服从自由度为(k , n-k-1)的 F 分布给定显著性水平，可得到临界值 F(k,n-k-1)，由样本求出统计量 F 的数值，通过F F(

46、k,n-k-1) 或 FF(k,n-k-1)来拒绝或接受原假设 H0，以判定原方程总体上的线性关系是否显著成立。对于中国居民人均消费支出的例子：一元模型：F=285.92二元模型：F=2057.3给定显著性水平 =0.05，查分布表，得到临界值：一元例：F (1,21)=4.32二元例： F(2,19)=3.52显然有 F F(k,n-k-1) 即二个模型的线性关系在 95%的水平下显著成立。2、关于拟合优度检验与方程显著性检验关系的讨论三、变量的显著性检验（t 检验）方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的因此，必须对每个解释变量进行显著性检验，以决定是否作为解释变

47、量被保留在模型中。这一检验是由对变量的 t 检验完成的。1、t 统计量由于12)()XCov以 cii 表示矩阵(X X)-1 主对角线上的第 i 个元素，于是参数估计量的方差为：iicVar2)(其中2 为随机误差项的方差，在实际计算时，用它的估计量代替: 12knei2、t 检验设计原假设与备择假设： H0： i=0 （i=1,2k） H1： i0 给定显著性水平，可得到临界值 t/2(n-k-1)，由样本求出统计量 t 的数值，通过|t| t/2(n-k-1) 或 |t|t/2(n-k-1)来拒绝或接受原假设 H0，从而判定对应的解释变量是否应包括在模型中。注意：一元线性回归中，

48、t 检验与 F 检验一致一方面，t 检验与 F 检验都是对相同的原假设 H0：1=0 进行检验;另一方面，两个统计量之间有如下关系： 221221 12)()()(txnexneyFiiii iii 在中国居民人均收入-消费支出二元模型例中，由应用软件计算出参数的 t 值：65.30.6.3210 ttt给定显著性水平 =0.05，查得相应临界值： t0.025(19) =2.093。可见，计算的所有 t 值都大于该临界值，所以拒绝原假设。即:包括常数项在内的 3 个解释变量都在 95%的水平下显著，都通过了变量显著性检验。四、参数的置信区间参数的置信区间用来考察：在一次抽样中所估计的参数值离参数的真实值有多“近” 。在变量的显著性检验中已经知道：)1(kntcStiiii e容易推出：在(1-)的置信水平下 i

展开阅读全文