1、1,计量经济学,2,第1章 一元线性回归模型第2章 多元线性回归模型第3章 非线性回归模型第4章 异方差第5章 序列相关第6章 多重共线性第7章 虚拟变量模型第8章 滞后变量模型第9章 联立方程模型,目录,目录,3,第10章 时间序列模型第11章 协整与误差修正模型第12章 向量自回归模型 第13章 时间序列条件异方差模型 第14章 面板数据计量模型第15章 二元因变量模型第16章 计量经济模型的建立,目录,4,绪论,一、计量经济学的定义二、计量经济学的特点三、计量经济学的目的 四、计量经济学的内容五、计量经济学的研究方法,5,若干代表性表述:“计量经济学是统计学、经济学和数学的结合。” (弗
2、瑞希) “计量经济学是用数学语言来表达经济理论,以便通过统计方法来论述这些理论的一门经济学分支。”(美国现代经济词典) “计量经济学可定义为:根据理论和观测的事实,运用合适的推理方法使之联系起来同时推导,对实际经济现象进行的数量分析。”(萨谬尔逊等)各种表述的共性: 计量经济学与经济理论、统计学、数学都有关系,一、计量经济学的定义,6,一般性定义:,计量经济学是统计学、经济学、数学相结合的一门综合性学科,是一门从数量上研究物质资料生产、交换、分配、消费等经济关系和经济活动规律及应用的科学。 研究的主体(出发点、归宿、核心): 经济活动及数量变化规律 研究的工具(手段): 模型数学和统计方法,7
3、,产生的历史: 起因:对经济问题的定量研究 名词:1926年弗瑞希仿造出 “Biometrics” “Econometrics” 标志:1930年成立计量经济学会 说明: “计量经济学” “经济计量学”特点: 计量经济学的重要特点是它自身并没有固定的经济理论,计量经济学中的各种计量方法和技术,大多来自数学和统计学。计量经济学产生的意义:从定性研究到定量分析的发展,是经济学更精密、更科学的表现,是现代经济学的重要特征,计量经济学的产生,8,计量经济学的发展:,计算机应用 模型的变量和方程 由少到多,又趋向较少 多个模型归并为整体模型 理论与方法的新突破 除了经典线性计量经济学模型以外,出现 非线
4、性模型、合理预期模型、变参数、半参数模型、动态模型、时间序列模型、协整理论、Panel Data数据模型、贝叶斯方法、小样本理论等新的研究领域 应用领域的拓展 宏观、微观经济领域应用 ,由预测为主转向更多地对经济理论假设和政策假设的检验,9,二、 计量经济学的特点,计量经济学用数学模型表示经济变量之间的关系。由于实际的经济运行不是在实验室进行的,往往存在 一些不确定的随机因素,使得经济变量之间的关系不能表还是成精确的函数关系。人们只能在模型中列出对所研究变量起主要影响作用的变量,将不重要的因素和一些不确定因素归并到一个随机变量中,建立变量之间的数学模型。,10,计量经济学中应用的数据,数据的来
5、源: 各种经济统计数据 专门调查取得的数据 人工制造的数据 数据类型: 时间数列数据(同一空间、不同时间) 截面数据(同一时间、不同空间) 混合数据(面板数据 panel data) 虚拟变量数据(用 0或1 表示的“非此即彼”的变量) 数据的要求:真实性、完整性、可比性,11,三、经济计量学的目的, 经济结构分析 分析变量之间的数量比例关系(如: 边际分析、弹 性分析、乘数分析) 例:分析消费增加对GDP的拉动作用 经济预测 由预先测定的解释变量去预测应变量在样本以外的数据 (动态预测、空间预测) 例:预测股票市场价格的走势 政策评价 用模型对政策方案作模拟测算,对政策方案作评价 (把计量经
6、济模型作为经济活动的实验室) 例:分析道路收费政策对汽车市场的影响,12,四、计量经济学的内容,理论计量经济学 研究经济计量的理论和方法 应用计量经济学 应用计量经济方法研究某些领域 的具体经济问题,13,计量经济学课程内容,经典计量经济学基础部分第1部分 回归分析基础第2部分 违背经典假定的回归模型第3部分 虚拟变量模型、动态计量模型与 联立方程模型,14,高级计量经济学本课程核心,第4部分 时间序列计量模型第10章 时间序列模型第11章 协整与误差修正模型第12章 向量自回归模型第13章 时间序列条件异方差模型,15,第5部分 回归分析的深入议题第14章 面板数据计量模型 固定效应与随机效
7、应模型第15章 二元因变量模型 probit与logit回归模型第16章 计量经济模型的建立 传统与现代计量经济学方法论,高级计量经济学本课程核心,16,五 计量经济学的研究方法,需要做的工作: 选择变量和数学关系式 建立模型 确定变量间的数量关系 估计参数 检验所得结论的可靠性 检验模型 作经济分析和经济预测 模型应用,17,搜集统计数据,模型应用,结构分析,实际经济活动,修改模型,不符合,符合,模型检验是否符合标准,经济预测,政策评价,经济理论,建立计量模型,参数估计,18,第 一 章一元线性回归模型,19,一、回归分析的概念 1、回归分析是处理变量与变量之间关系的一 种数学方法 2、经济
8、变量间的相互关系 确定性的函数关系 Yi= f(X i) 不确定性的统计关系 Yi= f(X i)+ui (ui为随机变量),第一节 模型的建立及其假定条件,20,二、回归线与回归函数,回归线:对于每一个X的取值 ,都有Y的条件期望E(Y )与之对应,代表这些Y的条件期望的点的轨迹所形成的直线或曲线,称为回归线。 回归函数:应变量Y的条件期望E(Y )随解释变量X的的变化而有规律的变化,如果把Y的条件期望E(Y )表现为X的某种函数 E(Y )=f ( ) 这个函数称为回归函数。 回归函数分为:总体回归函数 样本回归函数,21,前提:假如已知所研究的经济现象的总体应变量Y和解释变量X的每个观测
9、值, 可以计算出总体应变量Y的条件均值 E(Y ),并将其表现为解释变量X的某种函数 这个函数称为总体回归函数(PRF),总体回归函数(PRF),22,样本回归函数(SRF),样本回归线: 对于X的一定值,取得Y 的样本观测值,可计算其条件均值,样本观测值条件均值的轨迹,称为样本回归线。样本回归函数: 如果把应变量Y的样本条件均值表示为解释变量X的某种函数,这个函数称为样本回归函数(SRF)。 Y X,23,三、一元线性回归模型,一元线性回归模型形式如下 上式表示变量Yi和Xi之间的真实关系。其中Yi 称被解释变量(因变量),Xi称解释变量(自变量),ui称随机误差项,0称常数项,1称回归系数
10、(通常未知)。 上述模型可以分为两部分。(1)回归函数部分,E(Yi) = 0 + 1 Xi,(2)随机部分, ui 。,24,就变量而言是线性的 Y的条件均值是X的线性函数就参数而言是线性的 Y的条件均值是参数的线性函数判断: 变量、参数均”线性” 参数“线性”,变量”非线性” 变量“线性”,参数”非线性”计量经济学中线性回归模型主要指就参数是“线性”,对线性回归模型“线性” 的两种解释:,25,随机扰动项ui,概念 各个 值与条件均值 的偏差 代表排除在模型以外的 所有因素对Y的影响。性质: 是期望为0有一定分布的随机变量重要性:随机扰动项的性质决定着计量经济方法的选择,26,引入随机扰动
11、项的原因,未知影响因素的代表无法取得数据的已知影响因素的代表众多细小影响因素的综合代表模型的设定误差变量的观测误差变量内在随机性,27,为什么要作基本假定? 模型中有随机扰动,估计的参数是随机变量,只有对随机扰动的分布作出假定,才能确定所估计参数的分布性质,也才可能进行假设检和区间估计 只有具备一定的假定条件,所作出的估计才具有较好的统计性质。,四、一元线性回归的基本假定,28,基本假定的内容,对模型和变量的假定 对随机扰动项的假定 1、对模型和变量的假定 假定解释变量X是非随机的,或者虽然是随 机的,但与扰动项u是不相关的。 假定解释变量X在重复抽样中为固定值。 假定变量和模型无设定误差。,
12、29,2、对随机扰动项u的假定,又称高斯假定、古典假定 假定1:零均值假定: 在给定X的条件下 , 的条件期望为零 E( X)= 0 假定2:同方差假定: 在给定X的条件下, 的条件方差为某个常数,30,假定3:无自相关假定: 随机扰动项 的逐次值互不相关 Cov( , )=E -E( ) -E( ) =E( )=0 假定4:随机扰动 与解释变量 不相关 Cov( , )=E -E( ) -E( )=0,31,(顺便提出),假定5:对随机扰动项分布的正态性假定 即假定 服从均值为零、方差为 的正态分布 u N ( 0 , ) (说明:正态性假定不影响对参数的点估计,所以可不列入基本假定,但这对
13、确定所估计参数的分布性质是需要的。且根据中心极限定理,当样本容量趋于无穷大时, 的分布会趋近于正态分布。所以正态性假定是合理的),32,第二节 一元线性回归模型的参数估计,OLS的基本思想: 不同的估计方法可得到不同的样本回归参数 和 ,所估计的 也不同。 理想的估计方法应使 与 的差即剩余 越小越好 因 可正可负,所以可以取 最小即,1、普通最小二乘法OLS,33,取偏导数为0,得正规方程,用克莱姆法则求解得观测值形式的OLS估计量:,34,为表达得简洁,或者用离差形式OLS估计量: 注意其中:,35,2、OLS回归线的性质,可以证明:回归线通过样本均值 估计值 的均值等于实 际观测值 的均
14、值 剩余项 的均值为零,36,应变量估计值 与剩余项 不相关,解释变量 与剩余项 不相关,37,(一)参数估计值的评价标准 1、无偏性,前提:重复抽样中估计方法固定、样本数不变、经 重复抽样的观测值,可得一系列参数估计值参数估计值 的分布称为 的抽样分布,其密度函数记为f( ) 如果 E( ) = 称 是参数的无偏估计量,否则称 是有偏的,其偏倚为E( )-,第三节 最小二乘估计量的统计性质,38,概 率 密 度 估计值 偏倚,39,前提:样本相同、用不同的方法估计参数, 可以找到若干个不同的估计量 目标: 努力寻求其抽样分布具有最小方差的 估计量 最小方差准则,或称最佳 性准则 既是无偏的同
15、时又具有最小方差的估计量,称为最佳无偏估计量。,2、最小方差性,40,概 率 密 度 估计值,41,3、渐近性质(大样本性质),思想:当样本容量较小时,有时很难找到最佳无偏估计量, 需要考虑样本扩大后的性质(估计方法不变,样本数逐步增大,分析其性质是否改善)一致性: 当样本容量 n 趋于无穷大时,如果估计量 依概率收 敛于总体参数的真实值,就称这个估计式 是的一 致估计量。即 或 P Lim = n (渐近无偏估计式是当样本容量变得足够大时其偏倚趋于零的估计量),42,概 率 密 度 估计值,43,(二)OLS估计式的统计性质,由OLS估计量可以看出 由可观测的样本值 和 唯一表示。 因存在抽
16、样波动,OLS估计 是随机变量 OLS估计量是点估计量,44,2、 无偏特性 3、 最小方差特性 在所有的线性无偏估计中,OLS估计 具有 最小方差结论:OLS估计量是最佳线性无偏估计量(BLUE) (高斯定理),1、 线性特征 是Y的线性函数,45,第四节 用样本可决系数检验回归方程的拟合优度的度量,概念: 样本回归线是对样本数据的 一种拟合,不同估计方法可 拟合出不同的回归线,拟合 的回归线与样本观测值总有 偏离。样本回归线对样本观 测数据拟合的优劣程度 拟合优度 拟合优度的度量建立在对总变差分解的基础上,46,一、总离差平方和的分解,分析Y的观测值、估计值与平均值的关系 因为 ,将上式两
17、边平方加总,可证得 (TSS) (ESS) (RSS) 总变差 (TSS):应变量Y的观测值与其平均值的离差平方和(总 平方和) 解释了的变差 (ESS):应变量Y的估计值与其平均值的离差平方 和(回归平方和) 剩余平方和 (RSS):应变量观测值与估计值之差的平方和 (未解释的平方和),47,Y X,48,二、样本可决系数,以TSS同除总变差等式两边: 或 定义:回归平方和(解释了的变差ESS) 在总变差(TSS) 中所占的比重称为可决系数用 表示: 或,49,可决系数的作用:,可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。反之可决系数越小,说明模型对样本
18、观测值的拟合程度越差。 可决系数的特点: 可决系数取值范围: 随抽样波动,样本可决系数 是随抽样而变动的随 机变量 可决系数是非负的统计量,50,第五节 回归系数的区间估计和假设检验,为什么要作区间估计?OLS估计只是通过样本得到的点估计,不一定等于真实参数,还需要找到真实参数的可能范围,并说明其可靠性为什么要作假设检验?OLS 估计只是用样本估计的结果,是否可靠? 是否抽样的偶然结果?还有待统计检验。区间估计和假设检验都是建立在确定参数估计值 概率分布性质的基础上。,51,一、OLS估计的分布性质,基本思想 是随机变量,必须确定其分布性质才可能进行区间估计和假设检验 是服从正态分布的随机变量
19、, 决定了 也是服从正态分布的随机变量, 是 的线性函数,决定了 也是服从正态分布的随机变量只要确定 的期望和方差,即可确定 的分布性质,52, 的期望: (无偏估计) 的方差和标准误差 (标准误差是方差的平方根) 注意:以上各式中 未知,其余均是样本观测值,的期望和方差,53, 对随机扰动项方差 的估计: 可以证明(见附录2.2)其无偏估计为 (n-2为自由度,即可自由变化的样本观测值个数),54,在 已知时,将 作标准化变换:,55,当 未知时,,(1)当样本为小样本时,可用 代替 去估计参数的标准误差,用估计的参数标准误差对 作标准化变换,所得的 t 统计量不再服从正态分布(这时分母也是
20、随机变量),而是服从 t 分布:(2)当样本为大样本时,用估计的参数标准误差对 作标准化变换,所得Z统计量仍可视为标准正态变量。(根据中心极限定理),56,二、回归系数的区间估计,概念: 对参数作出的点估计是随机变量,虽然是无偏估计,但还不能说明估计的可靠性和精确性,需要找到包含真实参数的一个范围,并确定这个范围包含参数真实值的可靠程度。 在确定参数估计式概率分布性质的基础上,可找到两个正数和(01),使得区间 包含真实 的概率为1 , 即 这样的区间称为所估计参数的置信区间。 讨论:怎样正确理解置信区间?,57,一般情况下, 总体方差 未知,用无偏估计 去代替 ,由于样本容量较小,统计量 t
21、 不再服从正态分布,而服从 t 分布。可用 t 分布去建立参数估计的置信区间。 选定,查 t 分布表得显著性水平为/2,自由度为n-2的临界值 (n-2) ,则有即,回归系数区间估计的方法,58,三、回归系数的假设检验,1、假设检验的基本思想为什么要作假设检验? 所估计的回归系数 、 和方差 都是通过样本估计的,都是随抽样而变动的随机变量,它们是否可靠?是否抽样的偶然结果呢?还需要加以检验。,59,一般情况下, 总体方差 未知,只能用 去代替,可利用 t分布作 t 检验:,给定 , 查 t 分布表得如果 或者 (小概率事件发生) 则拒绝原假设 ,而接受备择假设如果 (大概率事件发生) 则接受原
22、假设,2、回归系数的检验方法,60,一、 因变量平均值的预测,1、基本思想运用计量经济模型作预测是利用所估计的样本回归函数 ,用解释变量的已知值或预测值,对预测期或样本以外的应变量数值作出定量的估计。计量经济预测是一种条件预测: 条件:模型设定的关系式不变 所估计的参数不变 解释变量在预测期的取值已作出预测 根据不同的标准,可将因变量的预测分为平均值预测和个别值预测点预测和区间预测,第六节 一元线性回归模型预测,61,预测值、平均值、个别值的相互关系:,Y 是真实平均值的点估计,也是对个别值的点估计,个别值,真实平均值,点预测值,62,2 、Y 平均值的点预测,将解释变量预测值直接代入估计的方
23、程 这样计算的 是一个点估计值,63,3、Y平均值的区间预测,基本思想:由于存在抽样波动,预测的平均值 不一定等于真实平均值 ,还需要对 作区间估计为对Y作区间预测,必须确定平均值预测值 的抽样分布必须找出与 和 都有关的统计量,64,具体作法 (从 的分布分析),已知 可以证明 服从正态分布(为什么?) ,将其标准化,当 未知时,,只得用 代替,这时有,65,给定显著性水平,查t分布表,得自由度n2的临界值 则有Y平均值的置信度为 的预测区间为,66,二、因变量个别值的预测,基本思想: 既是对Y平均值的点预测,也是对Y个别值的点预测。 由于存在随机扰动 的影响,Y的平均值并不等于Y的个别值
24、为了对Y的个别值 作区间预测,需要寻找与预测值 和个别值 有关的统计量,并要明确其概率分布,67,具体作法:,已知剩余项 是与预测值 和个别值 都有关的变量,并且已知 服从正态分布,且可证明 当用 代替 时,对 标准化 的变量 t 为,68,构建个别值置信区间,给定显著性水平 ,查 t 分布表得自由度为N2的临界值 ,则有 因此,一元回归时Y的个别值的置信度为1的预测区间上下限为,69,因变量Y区间预测的特点:,1、Y平均值的预测值与真实平均值有误差,主要是 受抽样波动影响 Y个别值的预测值与真实个别值的差异,不仅受抽样波动影响,而且还受随机扰动项的影响2、平均值和个别值预测区间都不是常数,是
25、随 的变化而变化的3、预测区间上下限与样本容量有关,当样本容量n时,个别值的预测误差只决定于随机扰 动的方差。,70,各种预测值的关系,Y平均值预测区间 Y个别值的预测区间,71,第 二 章多元线性回归模型,72,第一节 多元线性回归模型及古典假定 一、多元线性回归模型的意义 一般形式:对于有K个解释变量的线性回归模型 模型中 (j=0,1,2,k)是模型的回归系数,73,多元总体回归函数:Y 的总体条件均值表示为多个解释变量的函数 注意:这时Y总体条件均值的轨迹是K维空间的一条线或表示为多元样本回归函数: Y 的样本条件均值表示为多个解释变量的函数或 回归剩余(残差):,多元总体回归函数与多
26、元样本回归函数,74,二、多元线性回归模型的矩阵表示,K个解释变量的多元线性回归模型的 n个观测样本,可表示为 用矩阵表示 Y X u,75,用矩阵表示总体回归函数 或样本回归函数 或 其中: 都是有n个元素的列向量 是有k 个 元素的列向量 X 是第一列为1的nk阶解释变量数据 矩阵 (截距项可视为解释变量取值为1),76,三、多元线性回归中的基本假定,假定1:零均值假定 ( i=1,2,-n) 或 E(u)=0 假定2和假定3:同方差和无自相关假定: (i=j) 0 (ij) 假定4:随机扰动项与解释变量不相关 Cov( )=0 k=2,3,-k 假定5:无多重共线性假定 (多元中) 假定各解释变量之间不存在线性关系,或各个解释变量观 测值之间线性无关。或解释变量观测值矩阵X列满秩(K列)。 Ran(X)= k Rak(XX)=K 即 (XX) 可逆 假定6:正态性假定,