1、 使用普通最小二乘法,此时最小化的残差平方和为 211n iii yx 利用一元微积分可以证明, 1 必须满足一阶条件 11 0n i i ii x y x 从而解出 1 为: 11 21niiiniixyx 当且仅当 0x 时,这两个估计值才是相同的。 2.2 课后习题详解 一、 习题 1在简单线性回归模型 01y x u 中,假定 0Eu 。令 0 Eu ,证明:这个模型总可以改写为另一种形式:斜率与原来相同,但截距和误差有所不同,并且新的误差期望值为零。 证明: 在方程右边加上 0 Eu ,则 0 0 1 0y x u 令新的误差项为 0eu ,因此 0Ee 。 新的截距项为 00 ,斜
2、率不变为 1 。 2下表包含了 8 个学生的 ACT 分数和 GPA(平均成绩)。平均成绩以四分制计算,且保留一位小数。 student GPA ACT 1 2.8 21 2 3.4 24 3 3.0 26 4 3.5 27 5 3.6 29 6 3.0 25 7 2.7 25 8 3.7 30 ( )利用 OLS 估计 GPA 和 ACT 的关系;也就是说,求出如下方程中的截距和斜率估计值 01 GPA ACT 评价这个关系的方向。这里的截距有没有一个有用的解释?请说明。如果 ACT 分数提高 5 分,预期 GPA 会提高多少? ( )计算每次观测的拟合值和残差,并验证残差和(近似)为零。
3、( )当 20ACT 时, GPA 的预测值为多少? ( )对这 8 个学生来说, GPA 的变异中,有多少能由 ACT 解释?试说明。 答: ( )变量的均值为: 3.2125GPA , 25.875ACT 。 1 5 . 8 1 2 5n iii G P A G P A A C T A C T 根据公式 2.19 可得: 1 5 .8 1 2 5 / 5 6 .8 7 5 0 .1 0 2 2 。 根据公式 2.17 可知: 0 3 . 2 1 2 5 0 . 1 0 2 2 2 5 . 8 7 5 0 . 5 6 8 1 。 因此 0.5 68 1 0.1 02 2GPA AC T 。此
4、处截距没有一个很好的解释,因为对样本而言, ACT 并不接近 0。如果 ACT分数提高 5 分,预期 GPA 会提高 0.10225=0.511。 ( )每次观测的拟合值和残差表如表 2-3 所示: 表 2-3 i GPA GPA u 1 2.8 2.7143 0.0857 2 3.4 3.0209 0.3791 3 3.0 3.2253 -0.2253 4 3.5 3.3275 0.1725 5 3.6 3.5319 0.0681 6 3.0 3.1231 -0.1231 7 2.7 3.1231 -0.4231 8 3.7 3.6341 0.0659 根据表可知,残差和为 -0.002,忽
5、略固有的舍入误差,残差和近似为零。 ( )当 20ACT ,则 0.5681 0.1022 20 2.61G PA 。 ( )残差平方和为: 21 0.4347n ii u ,而 21 1.0288n ii yy ,则判定系数为: 2 1 S S R / S S T 1 0 . 4 3 7 7 / 1 . 0 2 8 8 0 . 5 7 7R GPA 的变异中,有 57.7%能由 ACT 解释。 3令 kids 表示一名妇女生过的孩子数目, educ 表示该妇女接受过教育的年数。生育率对受教育年数的简单回归模型为 01kids educ u 其中, u 是无法观测到的误差。 ( ) u 中包含
6、什么样的因素?它们可能与受教育程度相关吗? ( )简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。 答: ( )收入、年龄和家庭背景(如兄弟姐妹的数量)都可能包含在误差项中。它们可能是与受教育程度相关的:收入和受教育程度是呈正相关的;年龄与受教育程度是呈负相关的;兄弟姐妹的数量与受教育程度是负相关的。 ( )假定( )中所列举的因素固定不变,即以误差项的形式呈现在回归方程中,但是误差项与解释变量是相关的,因此 0E u educ ,经典假定被推翻,因此简单回归分析不能解释教育对生育率在其他条件不变下的影响。 4假设你对估计花在 SAT 备考课程上的小时数( hours )对
7、SAT 总分( sat )的影响感兴趣。 总体是某一年内所有计划上大学的中学高年级学生。 ( )假设你有权进行一项控制实验。请说明为了估计 hours 对 sat 的引致效应,你将如何构建实验。 ( )考虑一个更加实际的情形,即由学生选择在备考课程上花多少时间,而你只能随机地从总体中抽出 sat和 hours 的样本。将总体模型写作如下形式: 01sat hours u 其中,与通常带截距的模型一样,我们可以假设 0Eu 。列举出至少两个 u 中包含的因素。这些因素与 hours可能呈正相关还是负相关? ( )在( )的方程中,如果备考课程有效,那么 1 的符号应该是什么? ( )在( )的方
8、程中, 0 该如何解释? 答: ( )构建实验时,首先随机分配准备课程的小时数,以保证准备课程的时间与其他影响 SAT 的因素是独立的。然后收集实验中每个学生 SAT 的数据,建立样本 1 , : , ,iis at ho ur i n, n 表示试验中所包括的学生的数量。根据方程 2.7,应该尝试采用尽可能多的有差异的 “小时数 ”。 ( )误差项还可能包含以下三个因素:天赋能力、家庭收入以及考试当天的健康状况。如果学生拥有天赋能力,那么他们不需要为考试花费太多时间,能力与时间是负相关的。家庭收入与学习时间呈正相关关系,因为家庭收入越高,就能负担去越多的课时费用。排除慢性的健康问题,考试当天
9、的健康状况与为准备考试花费的时间是无关的。 ( )如果备考课程有效, 1 的符号应该为正,在其他因素相同的情况下,备 考时间越多, sat 越高。 ( )截距有一个有用的解释:因为 0EU , 0 表示备考时间为 0 时学生获得的平均 sat 总分。 5考虑储蓄函数 01sav inc u , u inc e 其中, e 是一个随机变量,且有 0Ee 和 2Var ee ,假设 e 独立于 inc 。 ( )证明:若 |0E u inc ,则满足零条件均值的关键假设(假定 SLR.4)。 提示:若 e 独立于 inc ,则 |E u inc E e ( )证明:若 2Var | eu inc
10、inc ,则不满足同方差假定 SLR.5。特别地, sav 的方差随着 inc 而增加。 提示:若 e 和 inc 独立,则 Var | Vare inc e 。 ( )讨论支持储蓄方差随着家庭收入递增的证据。 证明: ( )计算 inc 的条件期望值时, inc 变为一个常数,因此 |0E u i n c E i n c e i n c i n c E e i n c 。 ( ) inc 的方差为: 2 2V a r | V a r V a reu i n c i n c e i n c i n c e i n c i n c 。 ( )低收入家庭支出的灵活性较低,因为低收入家庭必须首先支付
11、衣食住行等必需品。而高收入家庭具有较高的灵活性,部分选择更多的消费,而另一部分家庭选择更多的储蓄。这种较高的灵活性暗示高收入家庭中储蓄的变动幅度更大。 6令 0 和 1 分别为 OLS 截距和斜率估计量,并令 u 为误差(不是残差)的样本均值。 ( )证明: 1 可写成111 n iii wu,其中 /SSTi i iwd 和 iid x x。 ( )利用( )及1 0n ii w ,证明: 1 和 u 无关。 提示:要求你证明 11 0Eu ( )证明 0 可写成 0 0 1 1 ux 。 ( )利用( )和( )证明: 2220V a r S S T xnx 。 ( )( )中的表达式能简
12、化成方程( 2.58)吗? 提示: 2121S S T /nxiin n x x 。 证明: ( )该理论推导与公式 2.52 的推导本质上是一样的,区别只是将 /SSTi i iwd 带到求和的里面。 ( )因为 1 1 1 c o v u E u ,公式右边等于 0。从 ( )可知, 1 1 1 1 nni i i i i iE u E w u w E u u 。因为误差项两两互不相关,则 0ihE uu , ih , 22/iiE u u E u n n。因此 221 1 1/ / 0n n ni i i i i i iw E u u w n n w 。 ( )最小二乘估计的截距公式为:
13、 0 yx , 代 入 01y x u ,则 0 0 1 1 0 1 1 x u x u x 。 ( )因为 1 和 u 是不相关的,则有: 2 2 2 2 2 2 20 1 x V a r V a r V a r / / S S T / / S S T xu x n x n x ( )能。 根据 2121S S T /nxiin n x x ,则 2202 1 2 2 2 2 1 211V a r S S T / / S S T/ S S T / S S Txxnni i x i i xnxn x x x n x 7利用 Kiel and McClain( 1995)有关 1988 年马萨诸
14、塞州安德沃市的房屋出售数据,如下方程给出了房屋价格( price )和距离一个新修垃圾焚化炉的距离( dist )之间的关系: 2lo g 9 .4 0 0 .3 1 2 lo g1 3 5 0 .1 6 2p r ic e d is tnR , ( )解释 log dist 的系数。它的符号是你所预期的吗? ( )你认为简单回归给出了 price 对 dist 在其他条件不变下弹性的无偏估计量吗?(考虑一个城市决定放置焚化炉的地点的决策。) ( )还有哪些其他因素影响房屋的售价?这些因素会与距离焚化炉的远近相关吗? 答: ( )符号为正,与预期相符。 log dist 的系数表示距离焚化炉的
15、距离越远,价格就越高,价格的距离弹性是 0.312,即距离远 1%,价格上升 0.312%。 ( )如果城市决定将焚化炉放置在远离较贵的居民区的地方,则 log dist 与房价是正相关的。这将违背假定 4,而 OLS 估计是有偏的。 ( )房屋的面积、洗手间的数量、占地面积大小、房龄社区质量(包括学校质量)都会影响房屋的售价 。这些与距离焚化炉的远近是有关的。 8 ( )令 0 和 1 为 iy 对 ix 进行回归的截距和斜率(有 n 次观测); 1c 和 2c 为常数且 2 0c ; 0 和 1 为 1icy对 2icx进行回归的截距和斜率。证明 1 2 0 /cc 且 0 1 0 c ,
16、从而验证了 2.4 节中关于度量单位的命题。 提示:为得到 1 ,把改变了度量单位的 x 和 y 代入方程( 2.19)。然后用方程( 2.17)求 0 ,确定代入的是进行度量单位变换后的 x 和 y 以及正确的斜率。 ( )现在令 0 和 1 得自( 1 icy )对( 2 icx )的回归(对 1c 和 2c 不加任何限制)。 证明: 11 且 0 0 1 2 1 cc 。 ( )令 0 和 1 为 log iy 对 ix 回归的 OLS 估计值,其中我们必须假定对所有 i ,都有 0iy 。对 1 0c ,令0 和 1 为 1log icy 对 ix 回归的截距和斜率证明: 11 且 0
17、 1 0 log c。 ( )现在假定对所有 i ,都有 0x 。令 0 和 1 为 iy 对 2log icx 回归的截距和斜率。 1 和 1 与 iy 对 log ix回归的截距和斜率相比如何? 答: ( )因为 11cy cy , 2 xcx cx ,当 为 1icy 对 2icx进行回归时,可以通过方程 2.19 得到方程的斜率: 2 2 1 1 1 211122 22 2 21111112221 =nni i i iiinniiiiniiiniic x c x c y c y c c x x y yc x c x c x xx x y yccxx 根据公式 2.17 可得截距项为:
18、0 1 1 2 1 1 2 1 2 1 1 1 0 /c y c x c y c c c x c y x c ( )使用与( )相同的方法,可得 11c y c y , 22c x c x 。因此 1 1 1 1i i ic y c y c y c y y y , 22iic x c x x x 。在 ( 1 icy )对( 2 icx )的回归中,1c 和 2c 被完全排除在斜率公式以外,以及 11 。 截距为: 0 1 1 2 1 1 2 1 1 2 1 0 1 2 1 c y c x c y c x y x c c c c 。 ( )因为 11lo g lo g lo giic y c
19、y,令 1c 代替 1logc , iy 代替 log iy ,且 2 0c ,然后采用 与( )相同的方法。 ( ) 采用 与( )相同的方法,设 1 0c , 2c 替代 2logc , ix 替代 log ix ,如果 0 和 1 是原截距和斜率,那么此时的截距和斜率为: 0 0 2 1 log c 和 11 。 9在线性消费函数 01 cons inc 中,收入的(估计)边际消费倾向( MPC )无非就是斜率 1 ,而平均消费倾向( APC )为 01 /cons inc inc 。利用对 100 个家庭的年收入和消费观测(均以美元计),便得到如下方程: 21 2 4 .8 4 0 .
20、8 5 31 0 0 0 .6 9 2c o n s in cnR , ( )解释这个方程中的截距,并评价它的符号和大小。 ( )当家庭收入为 30000 美元时,预计消费为多少? ( )以 inc 为横轴,画出估计的 MPC 和 APC 图。 答: ( )截距表示当 0inc , cons 预计将为 -124.84 美元。但这与事实不符,反映出消费函数在预测方面(尤其是收入处于较低的水平上时)是薄弱的。从年同比角度而言, 124.84 美元与 0 美元的差距并没有那么大。 ( )将 30000 美元代入方程:预计消费 1 2 4 .8 4 0 .8 5 3 3 0 0 0 0 2 5 4 6
21、 5 ( 美元)。 ( ) MPC 和 APC 如图 2-1 所示。即使截距是负的,样本中最小的 APC 是正的。图中从年均收入水平 1000美元开始。 图 2-1 10在高斯 -马尔可夫假定 SLR.1 SLR.5 之下,考虑标准的简单回归模型 01y x u 。通常的 OLS 估计量 0 和 1 都是各自总体参数的无偏估计量。令 1 表示通过假定截距为零而得到 1 的估计量(见 2.6 节)。 ( )用 1x 、 0 和 1 表示 1E 。证明:当总体截距( 0 )为零时, 1 是 1 的无偏估计量。 有没有其他的情况使得 1 也是无偏的? ( )求 1 的方差。(提示:方差不依赖于 0
22、。) ( )证明 11 Var Var。 提示:对任何数据样本, 2211nniix x x, 除非 0x ,否则该式严格不等。 ( )当我们要从 1 和 1 中做出选择时,评论偏误和方差的替代关系。 答: ( )从方程 2.66 可知: 211 1 nni i iiix y x 将 01i i iy x u 代入 可得: 0 11 211 nni i i iiix x u x 分子化简后可写为: 2011 1 1n n ni i i ii i ix x x u 因此 220111 1 1 1 n n n ni i i i ii i i ix x x u x 对于所有的 i 而言, 0iEu
23、,则: 21 0 111 nniiiixx 上式中右边的第一项表示 1 的偏差。当 0 0 、 0x 或1 0nii x 时, 1 是无偏的。 ( )根据( )中所表示的 1 ,可得方差为: 222 2 21 1 1 122 2 2 2 21111Va r Va r Va rn n n ni i i i i ii i i in n ni i ii i ix x u x x ux x x ( )根据公式 2.57, 221 1V a r /nii xx , 对任何数据样本, 2211nniiiix x x,除非 0x 。 因此 11 Var Var 。 ( )对于给定的样本而言,当 x 增加,
24、1 的有偏程度增加。但是当 x 增加时, 1 的变化与 1Var 是相关的。当 0 较小时, 1 的偏差也很小。因此 0 、 x 以及样本大小 n ( 21nii x的规模)决定了在均方误差上 1 和 1 的优劣。 11数据集 BWGHT.RAW 包含了美国妇女生育方面的数据。我们关心的两个变量是因变量 婴儿出生体重的盎司数( bwght ) 和解释变量 母亲在怀孕期间平均每天抽烟的根数( cigs ) 下面这个简单回归是用 1388n 个出生数据进行估计的: 1 1 9 .7 7 0 .5 1 4b w g h t c ig s ( )当 0cigs 时,预计婴儿的出生体重为多少?当 20c
25、igs (每天一包)时呢?评价其差别。 ( )这个简单回归能够得到婴儿出生体重和母亲抽烟习惯之间的因果关系吗?请解释。 ( )要预测出生体重 125 盎司, cigs 应该为多少? ( )样本中在怀孕期间不抽烟的妇女比例约为 0.85。这有助于解释第( )部分中的结论吗? 答: ( )当 0cigs 时,预计婴儿的出生体重为 119.77 盎司;当 20cigs 时,预计婴儿的出生体重为 109.49盎司,比前者下降 8.6%。 ( )不能。因为还有其他因素影响婴儿的出生体重,如母亲的整体健康状况和产前护理的质量。这些因素可能与怀孕期间吸烟量是相关的。另外,咖啡因的摄入也会影响到婴儿的出生体重
26、,这也与 吸烟量相关。 ( )要预测出生体重为 125 盎司,那么 1 2 5 1 1 9 . 7 7 / 0 . 5 2 4 1 0 . 1 8c i g s 。这是无意义的,它表明在一个解释变量的情况下预测出生体重会发生的后果。尽管有约 700 名婴儿的出生体重大于 119.77 盎司,但最大的预测出生体重不能超过 119.77 盎司。 ( )因为模型仅仅使用吸烟量来解释出生体重,因此仅有一个结果:即 0cigs 时的出生体重。 0cigs 时的预测结果必然大致位于样本数据的中间位置,因此可以预测高出生率。 二、 计算机习题 1 401K.RAW 中的数据是帕普克( Papke, 1995
27、)所分析数据的一个子集,帕普克是为了研究 401( k)养老金计划的参与率和该计划的慷慨程度之间的关系。变量 prate 是有资格参与该计划的员工中拥有活动账户的百分比,也是我们要解释的变量。慷慨程度指标是计划的匹配率 mrate 。这个变量给出了员工每向这个账户存 1 美元,公司为该员工匹配的平均数量。例如,若 0.50mrate ,则员工每投入 1 美元,公司就匹配 50 美分。 ( )求出该计划的样本中平均参与率和平均匹配率。 ( )现在估计下面这个简单回归方程 01 prate mrate 报告你的结果以及样本容量和 2R 。 ( )解释你的方程中的截距。解释 mrate 的系数。 (
28、 )当 3.5mrate 时,求出 prate 的 预测值。这是一个合理的预测吗?解释这里出现的情况。 ( V) prate 的变异中,有多少是由 mrate 解释的?你认为,这是一个足够大的量吗? 答: ( )平均参与率是 87.63%,平均匹配率是 0.732。 ( )回归方程为: 28 3 .0 5 5 .8 61 5 3 4 0 .0 7 5p r a te m r a tenR , ( )截距表示即使 0mrate ,预测的参与率是 83.05%。 mrate 的系数表明匹配率每增加 1 美元,则有资 格参与该计划的员工中拥有活动账户的百分比( prate )增加 5.86%。该结果
29、假定 prate 的变动是可能的。如果 prate已经达到 98%,那么截距就是无意义的。 ( ) 3.5mrate ,则 8 3 .0 5 5 .8 6 8 3 .0 5 5 .8 6 3 .5 1 0 3 .5 9p r a te m r a te 。这不是一个合理的预测,因为参与率不超过 100%。这表明因变量是有界限的,简单回归所预测的自变量的极值是不符合常理的。 ( V) prate 的变异中,有 7.5%是由 mrate 解释的,说明还有其他因素影响养老金计划参与率。 2数据集 CEOSAL2.RAW 包含了美国公司首席执行官的信息。变量 salary 是以千美元计的年薪, ceo
30、ten 是已担任公司 CEO 的年数。 ( )求出样本中的平均年薪和平均任期。 ( )有多少位 CEO 尚处于担任 CEO 的第一年(就是说, 0ceoten )?最长的 CEO 任期是多少? ( )估计简单回归模型 01lo g s a la r y c e o te n u ,用通常的形式报告你的结果。多担任一年 CEO,预计年薪增长(近似)的百分数是多少? 答: ( )平均年薪为 865.864 千美元,平均任期为 7.95 年。 ( )有 5 位 CEO 处于担任 CEO 的第一年。最长的 CEO 任期是 37 年。 ( )回归方程是: 2lo g 6 .5 1 0 .0 0 9 71
31、 7 7 0 .0 1 3s a l a r y c e o t e nnR , 多担任一年 CEO,预计年薪增长的近似百分数是 0.97%(或 1%)。 3利用 Biddle and Hamermesh( 1990)中的 SLEEP75.RAW 数据,研究在每周用于睡眠的时间和用于有酬工 作的时间之间是否存在替代关系。我们可以用它们中的任何一个作为因变量。为具体起见,估计模型 01sleep to tw rk u 其中, slep 是每周用于晚上睡眠的分钟数, totwrk 是这一周中用于工作的分钟数。 ( )用方程的形式,连同观测的次数和 2R 报告你的结果。该方程中的截距表示什么? (
32、)若 totwrk 增加 2 小时,则 slep 估计要减少多少?你觉得这是一个很大的效应吗? 答: ( )估计方程为: 235 86 .4 0. 15 170 6 0. 10 3sl e e p tot w rknR , 截距表示不工作的人每周用于晚上睡眠的时间为 3586.4 分钟。这意味着每晚睡眠的时间达到 8.5 小时。 ( )当 120totwrk,则 0 .1 5 1 1 2 0 1 8 .1 2s le e p (分钟)。这并不是一个很大的效应。如果某人工作日的工作时间均增加一小时,睡眠总减少时间约为 45 分钟,平摊在每晚只有约 6 分钟。 4利用 WAGE2.RAW 中的数据
33、估计一个简单回归,以便用智商( IQ )来解释月薪( wage )。 ( )求出样本中的平均工资和平均 IQ 。 IQ 的样本标准差是多少?(总体中的 IQ 已标准化为平均值是 100,标准差是 15。) ( )估计一个简单回归模型,其中 IQ 提高一个单位导致 wage 变化相同的数量。利用这个模型计算 IQ 提高 15 个单位时,工资的预期变化。 IQ 能够解释大多数工资变异吗? ( )现在再估计一个模型,其中 IQ 提高一个单位对工资具有相同的百分比影响。如果 IQ 提高 15 个单位,预期工资提高的百分比大约是多少? 答: ( )平均工资为 957.95 美元,平均 IQ 为 101.
34、28。 IQ 的样本标准差为 15.05,与总体标准差非常接近。 ( )简单回归模型为: 2116.9 9 8.3935 0.0 96w age IQnR , IQ 提高 15 个单位导致工资变化 8.315=124.5(美元)。 IQ 不能够解释大多数工资变异,薪水的变异中,仅有 9.6%是由 IQ 解释的。 ( )回归模型为: 2lo g 5 .8 9 0 .0 0 8 89 3 5 0 .0 9 9w a g e IQnR , 如果 IQ 提高 15 个单位,则 lo g 0 .0 0 8 8 1 5 0 .1 3 2w a g e ,因此 预期工资提高的百分比大约是 13.2%。 5在
35、化工产业的企业总体中,令 rd 表示年研发支出, sales 表示年销售额(都以百万美元计)。 ( )写一个模型(不是估计方程),其中 rd 和 sales 之间的弹性为常数。哪一个参数代表弹性? ( )再用 RDCHEM RAW 中的数据估计模型。用通常的形式写出估计方程。 rd 关于 sales 的弹性估计值是多少?用文字解释这个弹性的含义。 答: ( )不变弹性的对数 -对数模型为: 01lo g lo gr d s a le s u 参数 1 代表弹性。 ( )估计方程为: 2lo g 4 .1 0 5 1 .0 7 6 lo g3 2 0 .9 1 0r d s a l e snR
36、, rd 关于 sales 的弹性估计值是 1.076,说明 sales 每增长 1%, rd 将会增长 1.08%。 6例 2.12 中曾使用了 MEAP93.RAW 中的数据。现在,我们想用这个文件中的数据来说明数学通过率( 10math )与每个学生的平均支出( expend )之间的关系。 ( )就多花一美元对通过率的影响而言,你认为具有恒定不变的影响合适呢,还是这种影响越来越小更合适?请加以解释。 ( )在总体模型 011 0 lo gm a th e x p e n d u 中,证明 110 表示 expend 提高 10%导致 10math 改变的百分数。 ( )利用 MEAP9
37、3.RAW 中的数据,估计( )中的模型按照通常的方式报告估计方程,包括样本容量和及 2R 。 ( )支出的估计影响有 多大?也就是说,如果支出提高 10%,估计 10math 会提高多少个百分点? ( )有人担心这个回归分析可能得到 10math 的拟合值会超过 100。为什么在这个数据集中不必担心这个问题? 答: ( )多花一美元对通过率的影响而言,这种影响越来越小更合适。在支出较小的学校,多花钱可以用于购买更多的教材、电脑以及雇用高质量的教师,但在一个高支出水平上,即已经具备了大量教材、足够好的设备和高质量的教师时,再增加支出对通过率的影响几乎没有,即使有也会很小。 ( ) 111 0
38、l o g / 1 0 0 %m a t h e x p e n d e x p e n d ,如果 % 10ex end,则 110 /10math 。 ( )估计方程为: 21 0 6 9 .3 4 1 1 .1 6 l o g4 0 8 0 .0 2 9 7m a t h e x p e n dnR , ( )支出提高 10%,估计 10math 会提高 1.1%。支出的估计影响并不大,但这对低支出水平的学校而言是无影响的,因为 10%的支出增加从绝对数量上看是很小的。 ( )在这个数据集中,最大的 10math 为 66.7,远小于 100。实际上,最大的拟合值仅为 30.2。 7利用
39、 CHARITY.RAW 中的数据 得自于 Franses and Paap( 2001) 回答如下问题: ( )在这个 4268 人的样本中,平均捐款数量是多少(以荷兰盾为单位)?没有捐款的人数百分比是多少? ( )每年平均寄出的邮件数量是多少?其最小值和最大值是多少? ( )用普通最小二乘法估计如下模型 : 01g ift m a ilsyea r u 按照通常的方式报告估计方程,包括样本容量和 2R 。 ( )解释斜率系数。如果每封邮件的成本是 1 盾,那么慈善机构预期能够从寄出的每一封邮件中获得净利润吗?这意味着慈善机构从每封邮件中都获得了净利润吗?请加以解释。 ( )样本中最小慈善捐
40、款的预测值是多少?利用这个简单的回归分析,你有可能预测 gift 等于 0 吗? 答: ( )平均捐款数量为 7.44 荷兰盾。在 4268 个被调查者中, 2561 人没有捐款,占 60%。 ( )每年平均寄出的邮件量为 2.05。最小值为 0.25,这意味着有人每四年寄出一封邮件,最大值为 3.5。 ( )估计方程为: 22.01 0.654268 0.0138gif t mails y e arnR , ( )斜率系数为 2.65,意味着年均邮件量导致了额外 2.65 荷兰盾的捐赠。如果每一封邮件的成本是 1 盾,那么每封邮件的预期净收益则是 1.65 盾,然而这只是从平均角度而言的,并
41、不意味着慈善机构从每封邮件中都获得了净利润。部分邮件对捐赠量没有任何贡献,或者其贡献额小于邮寄成本,部分邮件可能产生远高于邮寄成本的捐赠量。 ( )样本中最小慈善捐款的预测值是: 2.01 2.65 0.25 2.67 。即使从总体来看,某些人没有收到邮件,最小慈善捐款为 2。因此不可能预测 gift 等于 0。 为了构造置信区间并进行检验,估计 j 的标准差也就是方差的平方根: 1 / 22s d / S S T 1j j jR 由于 未知,所以用其估计量 来取代,则: 1 / 22 s e / S S T 1j j jR 如果误差表现出异方差性,标准误公式就不是 sdj的一个可靠估计量,从
42、而使标准误无效。 五、 0LS 的有效性:高斯 -马尔可夫定理 1最优线性无偏估计量 ( 1)估计量:它是一个可应用于任何一个数据样本,并产生一个估计值的规则。 ( 2)无偏估计量:如果 j 的一个估计量,对任意 01 k , , , 都有 jjE ,那么它就是 j 的一个无偏估计量。 ( 3)“线性”: j 的一个估计量 j 是线性的充分必要条件是,它能表示成因变量数据的一个线性函数: 1nj ij ii wy 其中每个 ijw 都可以是所有自变量样本值的一个函数。 ( 4)“最优”:最优被定义为最小方差。 2定理 3.4:高斯 -马尔可夫定理 ( 1)主要内容 在假定 MLR.1 MLR.5 下, 01 k , , , 分别是 01 k , , , 的最优线性无偏估计量。 假定 MLR.1 MLR.5 被称为(横截面数据分析的)高斯 -马尔可夫假定。 ( 2)高斯 -马尔可夫定理的重要性 当这个标准假定集成立时,不需要再去寻找其他无偏估计量:没有一个会比 OLS 更好。 如果高斯 -马尔可夫假定中的任何一个不成立,那么这个定理也就不再成立。零条件均值的假定(假定 MLR.4)不成立会导致 OLS 产生偏误,异方差性(假定 MLR.5 不成立)虽不致使 OLS 有偏,但它在线性无偏估计量中不再具有最小方差。 3.2 课