1、第 1 章解决问题的办法1.1(一)理想的情况下,我们可以随机分配学生到不同尺寸的类。也就是说,每个学生被分配一个不同的类的大小,而不考虑任何学生的特点,能力和家庭背景。对于原因,我们将看到在第 2 章中,我们想的巨大变化,班级规模(主题,当然,伦理方面的考虑和资源约束) 。(二)呈负相关关系意味着,较大的一类大小是与较低的性能。因为班级规模较大的性能实际上伤害,我们可能会发现呈负相关。然而,随着观测数据,还有其他的原因,我们可能会发现负相关关系。例如,来自较富裕家庭的儿童可能更有可能参加班级规模较小的学校,和富裕的孩子一般在标准化考试中成绩更好。另一种可能性是,在学校,校长可能分配更好的学生
2、,以小班授课。或者,有些家长可能会坚持他们的孩子都在较小的类,这些家长往往是更多地参与子女的教育。(三)鉴于潜在的混杂因素 - 其中一些是第(ii)上市 - 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。1.2(一)这里是构成问题的一种方法:如果两家公司,说 A 和 B,相同的在各方面比 B公司 用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从 B 公司的不同?(二)公司很可能取决于工人的特点选择在职培训。一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。企业甚至可能歧视根据年龄,性别或
3、种族。也许企业选择提供培训,工人或多或少能力,其中, “能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。(iii )该金额的资金和技术工人也将影响输出。所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。管理者的素质也有效果。(iv)无,除非训练量是随机分配。许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。1.3 没有任何意义,提出这个问题的因果关系。经济学家会认为学生选择的混合学习和工作(和
4、其他活动,如上课,休闲,睡觉)的基础上的理性行为,如效用最大化的约束,在一个星期只有 168 小时。然后我们可以使用统计方法来衡量之间的关联学习和工作,包括回归分析,我们覆盖第 2 章开始。但我们不会声称一个变量“使”等。他们都选择学生的变量。第 2 章解决问题的办法2.1(I)的收入,年龄,家庭背景(如兄弟姐妹的人数)仅仅是几个可能性。似乎每个可以与这些年的教育。 (收入和教育可能是正相关,可能是负相关,年龄和受教育,因为在最近的同伙有妇女,平均而言,更多的教育和兄弟姐妹和教育的人数可能呈负相关) 。(ii)不会(i)部分中列出的因素,我们与 EDUC。因为我们想保持这些因素不变,它们的误差
5、项的一部分。但是,如果 u 与 EDUC 那么 E(U | EDUC)0 ,所以 SLR.4 失败。2.2 方程 Y =0 +1X + U,加减 0 的右边,得到 y =( 0 +0)+1X +(U0 ) 。调用新的错误 E =0,故 E(E)= 0。新的拦截0 +0,但斜率仍然是1 。2.3(一)让易= GPAI,XI = ACTI,和 n = 8。 = 25.875,= 3.2125, (十一 - ) (艺 - )= 5.8125, (十一 - )2 = 56.875。从公式(2.9) ,我们得到了坡度为= 5.8125/56.875 0.1022,四舍五入至小数点后四个地方。 (2.17
6、)= - 3.2125 - 0.1022 25.875 0.5681。因此,我们可以这样写= 0.5681 + 0.1022 ACT每组 8 只。拦截没有一个有用的解释,因为使不接近零的人口的利益。 ,如果 ACT 是高 5 点,增加0.1022(5)= .511。(二)观察数 i 和 GPA 的拟合值和残差 - 四舍五入至小数点后四位 - 随着于下表:GPA1 2.8 2.7143 0.08572 3.4 3.0209 0.37913 3.0 3.2253 - 0.22534 3.5 3.3275 0.17255 3.6 3.5319 0.06816 3.0 3.1231 - 0.12317
7、 2.7 3.1231 - 0.42318 3.7 3.6341 0.0659您可以验证的残差,表中报告,总结到.0002 ,这是非常接近零,由于固有的舍入误差。()当 ACT = 20 = 0.5681 + 0.1022(20)2.61。(iv)本残差平方和,大约是 0.4347(四舍五入至小数点后四位) ,正方形的总和, (YI - )2,大约是 1.0288。因此,R-平方的回归R2 = 1 - SSR / SST 1 - (.4347/1.0288 ).577 的。因此,约 57.7的 GPA 的变化解释使学生在这个小样本。2.4(I)的 CIGS = 0,预测出生体重是 119.77
8、 盎司。当 CIGS = 20,= 109.49。这是关于一个 8.6的降幅。(ii)并非必然。还有许多其他的因素,可以影响新生儿的体重,尤其是整体健康的母亲和产前护理质量。这些可以与吸烟密切相关,在分娩期间。此外,如咖啡因消费的东西可以影响新生儿的体重,也可能与吸烟密切相关。(三)如果我们想预测 125 bwght,然后 CIGS =(125 - 119.77)/ ( - .524)-10.18,或约-10 香烟!当然,这完全是无稽之谈,并表明会发生什么,当我们试图预测复杂,出生时体重只有一个单一的解释变量的东西。最大的预测出生体重必然是 119.77。然而,近 700 个样品中有出生出生体
9、重高于 119.77。(四)1,176 1,388 名妇女没有在怀孕期间吸烟,或约 84.7。因为我们使用的唯一的的CIGS 解释出生体重,我们只有一个预测出生体重在 CIGS = 0。预测出生体重必然是大致中间观察出生体重在 CIGS = 0,所以我们会根据预测高出生率。2.5(i)本截距意味着, ,当 INC = 0,缺点被预测为负 124.84 美元。 ,当然,这不可能是真实的,反映了这一事实,在收入很低的水平,这个消费函数可能是一个糟糕的预测消费。另一方面,在年度基础上,124.84 美元至今没有从零。(二)只需插上 30,000 入公式:= -124.84 + .853(30,000
10、)= 25,465.16 元。(iii )该 MPC 和 APC 的是在下面的图表所示。尽管截距为负时,样品中的最小的 APC 是正的。图开始以每年 1,000 元(1970 美元)的收入水平。2.6(i)同意。如果生活密切焚化炉抑制房价过快上涨,然后越远,增加住房价格。(ii)若选择的城市定位在一个地区焚化炉远离更昂贵的街区,然后登录(区)呈正相关,与房屋质量。这将违反 SLR.4,OLS 估计是有失偏颇。(三)大小的房子,浴室的数量,很多的大小,年龄,家庭,居委会(包括学校质量)质量,都只是极少数的因素。正如前面提到的(ii)部分,这些肯定会被分派 日志(DIST)的相关性。2.7(一)当
11、我们条件的公司在计算的期望,成为一个常数。所以 E(U | INC)= E(E | INC)= E (E | INC)= 0,因为 E(E | INC)= E(E)= 0。(2)同样,当我们条件的公司在计算方差,成为一个常数。所以 VAR(U | INC)= VAR(E | INC )= ()2VAR (E | INC )INC ,因为 VAR(E | INC)=。(三)家庭收入低没有对消费有很大的自由裁量权,通常情况下,一个低收入的家庭必须花费在食品,服装,住房,和其他生活必需品。收入高的人有更多的自由裁量权,有些人可能会选择更多的消费,而其他更节省。此酌情权,建议在收入较高的家庭储蓄之间的
12、更广泛的变异。第 2.8(i)从方程(2.66) ,= /。堵在义=0 +1xi + UI 给人= /。标准代数后,分子可以写为。把这个分母显示,我们可以写=0 / +1 + /。西安条件,我们有E()=0 / +1因为 E(UI )对于所有的 i = 0。因此,偏置在这个方程中的第一项由下式给出。这种偏见显然是零,当0 = 0。也为零时,= 0,= 0 这是相同的。在后者的情况下,通过原点的回归是回归截距相同。(ii)从最后一个表达式部分(i)我们有,有条件兮,(VAR)= VAR = /。(iii )由(2.57) ,VAR() = 2 /。从心领神会, ,所以无功():VAR () 。看
13、,这是一种更直接的方式来写,这是小于除非= 0 =。()对于一个给定的样本大小,偏置的增加(保持在固定的总和)的增加。但增加的方差相对增加(VAR) 。偏置也是小的,小的时候。因此,无论是我们优选的平均平方误差的基础上取决于大小,和 n(除的大小) 。2.9(i)我们按照提示,注意到 =(样本均值为 C1 义的样本平均) =。当我们:回归 c1yi c2xi(包括截距)我们使用公式(2.19)获得的斜率:(2.17) ,我们得到的截距=(C1) - (C2)=(C1 ) - (C1/C2) (C2 )= C1( - )= C1) ,因为拦截从回归毅喜( - ) 。(ii)我们使用相同的方法,伴
14、随着一个事实,即(i)部分= C1 + C2 +。因此,=(C1 +易)- (C1 +)=易 - (C2 + XI) - = XI - 。因此,C1 和 C2 完全辍学的回归(C1 +毅) (C2 + XI)和= 的斜率公式。截距= - =(C1 +) - (C2 +)= ()+ C1 - C2 = C1 - C2,这就是我们想向大家展示。(三) ,我们可以简单地适用(ii)部分,因为。换言之,更换 C1 与日志(C1) ,易建联与日志(彝族) ,并设置 C2 = 0。(iv)同样的,我们可以申请 C1 = 0 和更换 C2 日志(C2)和 xi 日志(十一) (ii)部分。如果原来的截距和斜
15、率,然后。2.10(一)该推导基本上是在方程(2.52) ,一旦带内的求和(这是有效的,因为不依赖于i) 。然后,只需定义。()由于我们表明,后者是零。但是,从(i)部分,因为是两两相关(他们是独立的) , (因为) 。因此,(iii )本的 OLS 拦截的公式,堵在给(4)因为是不相关的,这就是我们想向大家展示。(五)使用提示和替代给2.11(一)我们想要,随机指定小时数,这样在准备课程时间不受其他因素影响性能的SAT。然后,我们将收集信息为每一个学生的 SAT 分数在实验中产生的数据集,其中 n 是我们可以负担得起的学生人数在研究。从公式(2.7) ,我们应该试图得到尽可能多的变化是可行的
16、。(二)这里有三个因素:先天的能力,家庭收入,和一般健康检查当天上。如果我们认为具有较高的原生智慧的学生认为,他们不需要准备 SAT,能力和时间呈负相关。家庭收入可能会与时间呈正相关,因为高收入家庭可以更容易负担得起的预备课程。排除慢性健康问题,健康考试当天应大致准备课程的时间无关。(iii )倘预备课程是有效的,应该是积极的:,应加大坐在其他因素相等,增加小时。(iv)本拦截,在这个例子中有一个有用的解释:因为 E(U)= 0 时,平均 SAT 成绩的学生在人口小时= 0。第 3 章解决问题的办法3.1(I)hsperc 定义使得较小的是,较低的高中学生的地位。一切平等,在高中学生中的地位恶
17、化,较低的是他/她预期的大学 GPA。(二)只要将这些值代入方程:= 1.392.0135(20)+ 0.00148(1050)= 2.676。(三)A 和 B 之间的区别仅仅是 140 倍的系数上周六, ,因为 hsperc 是相同的两个学生。所以 A 预测都有得分 0.00148(140)高.207。(四)随着 hsperc 固定= 0.00148坐着。现在,我们要找出 坐在= 0.5,所以 0.5 = 0.00148( 坐)或 坐在= 0.5 /(0.00148)338。也许并不奇怪,其他条件不变的情况下差异大的 SAT 分数 - 几乎两个和一个半标准差 - 需要获得大学 GPA 或半个
18、点的预测差异。3.2(i)同意。由于预算的限制,它是有道理的,在一个家庭中的兄弟姐妹有,任何一个家庭中的孩子受教育较少的。要找到降低预测的教育一年的兄弟姐妹的数量的增加,我们解决 1 = .094(SIBS ) ,所以后后SIBS = 1/.094 10.6。(二)控股 SIBS feduc 的固定,一年以上母亲的教育意味着 0.131 年预测教育。所以,如果母亲有 4 年以上的教育,她的儿子被预测有大约了半年(.524)更多的受教育年限。(三)由于兄弟姐妹的人数是一样的,但 meduc feduc 都是不同的,系数在 meduc feduc 都需要进行核算。 B 和 A 是 0.131(4)
19、+ .210(4)= 1.364 之间的预测差异教育。3.3(i)若成年人睡眠权衡工作,更多的工作意味着较少的睡眠(其他条件不变) ,所以0, 0。 LSAT 和 GPA 都进入一流的质量的措施。更好的学生参加法学院无论身在何处,我们期望他们赚得更多,平均。 , 0。在法库的学费成本的卷数的学校质量的两个措施。 (成本库卷那么明显,但应反映质量的教师,物理植物,依此类推) 。(三)这是对 GPA 只是系数,再乘以 100:24.8。(四)这是一个弹性:百分之一的在库量增加暗示了.095的增长预测中位数的起薪,其他条件相同的情况。(五)这肯定是具有较低职级,更好地参加法学院。如果法学院有小于法
20、B 校排名 20,预测差异起薪是 100(.0033) (20)=上升 6.6,为法学院 A.根据定义 3.5(I)号,学习+睡觉+工作+休闲= 168。因此,如果我们改变的研究,我们必须改变至少一个其他类别的,这样的总和仍然是 168。(ii)由(i)部分,我们可以写,说,作为一个完美的其他自变量的线性函数研究:研究= 168睡眠 休闲工作。这适用于每个观察,所以 MLR.3 侵犯。(三)只需拖放一个独立的变量,说休闲:GPA = +学习+ 睡觉+上班+ U。现在,例如,GPA 的变化,研究增加一小时,睡眠,工作,和 u 都固定时,被解释为。如果我们持有的睡眠和固定的工作,但增加一个小时的研
21、究,那么我们就必须减少一小时的休闲。等坡面参数有一个类似的解释。3.6 空调解释变量的结果,我们有= E(+)= E()+ E()=1 +2 =。3.7() ,省略了一个重要的变量,可能会导致偏置,并且只有当被删去的变量与所包含的解释变量,这是真实的。同方差的假设,MLR.5 表明 OLS 估计量是公正的,没有发挥作用。 (同方差被用于获得通常的方差的公式) 。另外,样品中的解释变量之间的共线性的程度,即使它被反映在高的相关性为 0.95,不影响高斯 - 马尔可夫假设。仅当存在一个完美的线性关系,在两个或更多的解释变量 MLR.3 侵犯。3.8 我们可以用表 3.2。根据定义, 0,假设更正(
22、1,2) 0,E() 。3.9(一) 0 和Corr(X1,X2) 0。(ii)本比例的影响是 0.00024(50)= 0.012。要获得的百分比效果,我们将此乘以100:1.2。因此,50 点其他条件不变的 ROS 增加预计将增加只有 1.2的工资。实事求是地讲,这是一个非常小的影响这么大的变化,ROS。(三)10的临界值单尾测试,使用 DF =,是从表 G.2 为 1.282。 t 统计量 ROS 是.00024/.00054 .44,这是远低于临界值。因此,我们无法在 10的显着性水平拒绝 H0。(四)基于这个样本,估计的 ROS 系数出现异于零,不仅是因为采样变化。另一方面,包括活性
23、氧可能不造成任何伤害,这取决于它是与其他自变量(虽然这些方程中是非常显着的,即使是与活性氧)如何相关。4.3(一) ,控股 profmarg 固定,= .321日志(销售)=(.321/100)100 0.00321( 销售) 。因此,如果 销售= 10,.032,或只有约 3/100 个百分点。对于这样一个庞大的销售百分比增加,这似乎像一个实际影响较小。(二)H0:= 0 与 H1: 0,是人口坡日志(销售) 。 t 统计量是.321/.216 1.486。从表 G.2获得 5的临界值,单尾测试,使用 df = 32 - 3 = 29,为 1.699;所以我们不能拒绝 H0 在 5的水平。但
24、 10的临界值是 1.311;高于此值的 t 统计以来,我们拒绝 H0 而支持 H1 在 10的水平。(三)不尽然。其 t 统计量只有 1.087,这是大大低于 10的临界值单尾测试。4.4(一)H 0:= 0。 H1:0 。(ii)其他条件相同的情况,一个更大的人口会增加对房屋的需求,这应该增加租金。整体房屋的需求是更高的平均收入较高,推高了住房的成本,包括租金价格。(iii )该日志系数(弹出)是弹性的。正确的语句是“增加了 10的人口会增加租金.066(10)= 0.66。 ”(四)用 df = 64 - 4 = 60,双尾检验 1的临界值是 2.660。 T 统计值约为 3.29,远高
25、于临界值。那么,在 1的水平上显着差异从零。4.5(I).4121.96 (.094) ,或约 0.228 至 0.596。(二)没有,因为值 0.4 以及 95CI 里面。(三)是的,因为 1 是远远超出 95CI。4.6(一)使用 df = N - 2 = 86,我们得到 5的临界值时,从表 G.2 与 DF = 90。因为每个测试是双尾,临界值是 1.987。 t 统计量为 H0:= 0 是关于 - 0.89,这是远小于 1.987 的绝对值。因此,我们无法拒绝= 0。 t 统计量为 H0:= 1(0.976 - 1)/ 0.049 - 0.49,这是不太显着。 (请记住,我们拒绝 H0
26、 而支持 H1 在这种情况下,仅当 | T | 1.987。 )(ii)我们使用的 F 统计量的 SSR 形式。我们正在测试 q = 2 的限制和 DF 在不受限制模型是 86。我们 SSRR = 209,448.99 SSRur 的= 165,644.51。因此,这是一种强烈的拒绝 H0:从表 G.3c,2 和 90 DF 1的临界值是 4.85。(三)我们使用的 F 统计量的 R 平方的形式。我们正在测试 q = 3 的限制,并有 88 - 5 = 83 DF 无限制模型。 F 统计量为 (0.829 - 0.820)/(1 - 0.829) (83/3)1.46。 10的临界值(再次使用
27、 90 分母 DF 表 G.3a 中)为 2.15,所以我们不能拒绝 H0 甚至 10的水平。事实上,p 值是 0.23 左右。(四)如果存在异方差,假设 MLR.5 将被侵犯,不会有 F 统计量 F 分布的零假设下。因此,对一般的临界值 F 统计量进行比较,或获得的 p 值 F 分布的,不具有特别的意义。4.7(一)虽然,没有改变对 hrsemp 的标准误差,系数的大小增加了一半。不见了的 t 统计hrsemp 已约-1.47 至-2.21,所以现在的系数是统计上小于零,在 5的水平。 (从表 G.2 40 DF 5的临界值是-1.684。1的临界值-2.423,p 值在 0.01 和 0.
28、05 之间。 )(ii)倘我们从右手侧的日志(聘用)加减法和收集方面,我们有登录(报废)= + hrsemp + 日志(销售) - 日志(受雇于) + 日志(就业)+ 日志(就业) + U= + hrsemp +日志(销售 /聘请)+(+ )日志(应用)+ U,其中第二个等式的事实,日志(销售/聘请)=日志(销售) - 日志(就业) 。定义+ 给出结果。(三)号,我们有兴趣在日志(聘用)的系数,其中有统计.2,这是非常小的。因此,我们的结论是,作为衡量企业规模的员工,不要紧,一旦我们控制了每名员工的培训和销售(以对数函数形式) 。(四) (ii)部分模型中的零假设 H0:= -1。 T 统计值
29、 - .951 - (-1) / 0.37 =(1 - 0.951)/ 0.37 .132,这是非常小的,我们不能拒绝我们是否指定一个或双面替代品。4.8(i)我们使用物业 VAR.3 的附录 B:VAR (3 )=(VAR)+ 9(VAR) - 6 COV(, ) 。(二)T = (31 )/ SE(3 ) ,所以我们需要的标准误差 3。(三)由于= - 32 ,我们可以写= + 32 。堵到这一点的人口模型给出Y = +( + 32)X1 + X2 + X3 + U= + X1 +(3X1 + X2)+ X3 + U。这最后的方程是我们所估计的回归,3X1 X1 + X2,X3 上的 y。
30、 X1 的系数和标准错误是我们想要的。4.9(一)用 df = 706 - 4 = 702,我们使用标准的正常临界值(DF =表 G.2) ,这是 1.96,双尾检验在 5的水平。现在 teduc = 11.13/5.881.89,因此| teduc | = 1.89 3.00) 。事实上,p 值是 0.019,所以 educ 的年龄是共同在 2的水平上显着。(三)不尽然。这些变量联合显着,但包括他们只改变的系数 totwrk - 0.151 - .148。(四)标准的 T 和 F 统计量,我们使用承担同方差,除了其他 CLM 假设。如果是在方程中的异方差性,测试不再有效。4.10(一)我们需
31、要计算的 F 统计量的整体意义的回归,其中 n = 142 和 k = 4:F = 0.0395 /(1 - 0.0395)(137/4)1.41。 5与 4 分子 DF 和使用分子 DF 120 的临界值,为 2.45,这是上面的 F 值,因此,我们不能拒绝 H0:= 0 在 10的水平。没有解释变量是单独在 5的水平上显着。最大的绝对 t 统计量,TDKR 1.60 丹麦克朗,这是不是在 5的水平对一个双面的替代显着。(ii)本 F 统计量(具有相同的自由度)0.0330 /(1 - 0.0330) (137/4 )1.17,甚至低于(i)部分中。 t 统计量是没有在一个合理的水平具有重要
32、意义。(三)似乎非常薄弱。在这两种情况下,在 5的水平上没有显着性的 t 统计量(对一个双面替代) ,F 统计量是微不足道的。另外,小于 4的回报的变化是由独立的变量说明。4.11(i)于柱(2)和(3) , profmarg 系数实际上是否定的,虽然它的是 t 统计量只有约-1。出现,一旦公司的销售和市场价值已经被控制,利润率有没有影响 CEO 薪水。(ii)我们使用列(3) ,它控制的最重要因素,影响工资。 t 统计日志(mktval)大约是2.05,这仅仅是对一个双面的替代在 5的水平显着。 (我们可以使用标准的正常临界值,1.96 元。 )所以日志(mktval)的是统计学上显著。因为
33、系数是一个弹性,在其他条件不变的情况下增加 10,市场价值预计将增加 1的工资。这不是一个很大的效果,但它是不可忽略的,或者。(三)这些变量是个别显著低的显着性水平,与 tceoten 3.11 和-2.79 tcomten 的。其他因素不变,又是一年,与该公司的首席执行官由约 1.71增加工资。另一方面,又是一年与公司,但不担任 CEO,降低工资约 0.92。首先这第二个发现似乎令人惊讶,但可能与“超级巨星”的效果:从公司外部聘请首席执行官的公司往往备受推崇的候选人去后,一个小水池,这些人的工资被哄抬。更多非 CEO 年与一家公司,使得它不太可能的人被聘为外部巨星。第 5 章5.1 写 Y
34、= + X1 + u 和预期值:E(Y)= + E(X1)+ E(U ) ,或为 y= +X 自 E(U)= 0,其中为 y= E( )和 X= E(X1) 。我们可以改写为 y - X。现在,= 。考虑这一点,我们有 PLIM(PLIM)= PLIM( )=() - PLIM PLIM()PLIM()=为yX ,在这里我们使用的事实 PLIM()=为 y 和 PLIM()=X 大数定律和PLIM()=。我们还使用了部分物业 PLIM.2 从附录 C。5.2 意味着较高的风险承受能力,因此更愿意投资在股市 0。由假设,资金和 risktol 的正相关。现在我们使用公式(5.5) ,1 0:PL
35、IM()= +1,因此具有积极的不一致(渐近偏置) 。这是有道理的:如果我们忽略从回归 risktol,资金呈正相关,一些资金估计影响的实际上是由于到 risktol 效果的。5.3 变量的 CIGS 无关接近正常分布在人口。大多数人不抽烟,所以 CIGS = 0,超过一半的人口。一般情况下,一个分布的随机变量需要以正概率没有特别的价值。此外,分配的CIGS 歪斜,而一个正态随机变量必须是对称的,有关它的均值。5.4 写 Y = + X + u 和预期值:E(Y)= + E()+ E(U) ,或为 y= +X,因为 E(U )= 0,其中为 y= E( y)和 X= E(X ) 。我们可以改写
36、为 yX 。现在,= 。考虑这一点,我们有 PLIM(PLIM)= PLIM( )=() - PLIM PLIM()PLIM ()=为yX ,在这里我们使用的事实,PLIM()=()=X 为 yPLIM 大数定律和PLIM()=。我们还使用了部分该物业 PLIM.2 从附录 C。第 6 章6.1 一般性是没有必要的。 t 统计 roe2 只有约.30 ,这表明的 roe2 是非常统计学意义。此外,平方项只有很小的影响在斜坡上,甚至鱼子大值。 (大致坡 0.0215.00016 鱼子,甚至当净资产收益率= 25 - 约一个标准差以上样本中的平均净资产收益率 - 坡度为 0.211,较净资产收益率
37、= 0 .215) 。6.2 定义的 OLS 回归 c0yi 的上 c1xi1,ckxik,I = 2,N ,解决我们取得这些从方程(3.13) ,我们将在规模依赖和独立的变量。我们现在表明,如果=,= ,J = 1,.,K,那么这 k + 1 阶条件感到满意,这证明的结果,因为我们知道,OLS估计是方便旗(一旦我们排除在独立变量完全共线性)的独特的解决方案。堵在这些猜测给出了表达式对于 j = 1,2,. ,K。我们可以写简单的取消显示这些方程和或分解出常数,和,J = 1,2,但相同乘以 c0 和 c0cj 的是由第一阶条件为零,因为根据定义,他们获得 XI1 易建联的回归,XIK ,I
38、= 1,2,.,。因此,我们已经表明,= C0 =(c0/cj) ,J = 1, ,K 解决所需的一阶条件。6.3(I)/(2 周转点| |) ,或 0.0003 /(0.000000014)21,428.57,请记住,这是在数百万美元的销售。(二)可能。其 t 统计量为-1.89,这是重大反对片面替代 H0: 0,如果我们认为一个孩子得到更多的教育又是一年更多受过良好教育的孩子的父母。(ii)我们使用值 pareduc = 32 和 pareduc = 24 来解释的系数 EDUC pareduc 的。估计教育回报的差异是 0.00078(32 - 24)= 0.0062,或约 0.62 个
39、百分点。()当我们添加 pareduc 的本身,交互项的系数是负的。在 EDUC pareduc 的 t 统计量为-1.33,这是不是在 10的水平对一个双面的替代显着。需要注意的是对 pareduc 系数对一个双面的替代在 5的水平是显着的。这提供了一个很好的例子,省略了水平效应(在这种情况 pareduc)如何可以导致有偏估计的相互作用效果。6.5 这将使意义不大。数学和科学考试的表演是教育过程的产出的措施,而我们想知道的各种教育投入和办学特色如何影响数学和科学成绩。例如,如果员工与学生的比例有两种考试成绩的影响,为什么我们要保持固定的科学测试上的表现,同时研究人员的影响,数学合格率?这将
40、是一个例子,在回归方程控制的因素太多。变量 scill 可能是一个因变量,在一个相同的回归方程。6.6 扩展模型具有 DF = 680 - 10 = 671,和我们测试两个限制。因此, F = (.232 - .229)/(1 - .232) ( 671/2)1.31,这是远低于 10的临界值 2 和DF :CV = 2.30 F 分布。因此,atndrte2 和 ACT atndrte 的联合不显着。因为添加这些条款复杂的模型,没有统计的理由,我们不会包括他们在最后的模型。6.7 第二个等式显然是优选的,作为其调整 R 平方是显着大于在其他两个方程。第二个等式中包含相同数目的估计参数为第一,
41、减少了一个比第三。第二个方程也比第三更容易解释。6.8(I)的答案是不是整个明显,但是我们必须在这两种情况下,正确地解释酒精系数。如果我们包括参加,然后我们测量大学 GPA 的酒精消费量的效果,拿着考勤固定。因为上座率可能是一个重要的机制,通过饮用会影响性能,我们可能不希望持有它固定在分析。如果我们这样做,包括参加,那么我们的估计解释作为那些的影响 colGPA 不因上课。 (例如,我们可以测量饮酒对学习时间的影响。 )为了得到一个总的酒精消费量的影响,我们将离开参加了。(二)我们会想包括 SAT 和 hsGPA,作为对照组,这些衡量学生的能力和动机。可以在大学的饮酒行为与在高中的表现,并在标
42、准化考试。其他因素,如家庭背景,也将是很好的控制。第 7 章7.1(一)男性的系数是 87.75,所以估计一个人睡差不多一个半小时,每星期比一个可比的女人。此外,tmale = 87.75/34.332.56,这是接近 1的临界值对一个双面替代(约2.58) 。因此,性别差异的证据是相当强的。(ii)本 totwrk t 统计.163/.0189.06 ,这是非常统计学意义。系数意味着,一个小时的工作时间(60 分钟)0.163(60)相关联9.8 分钟的睡眠。(三)取得,限制回归的 R 平方,我们需要对模型进行估计没有年龄和 AGE2 的。当年龄和 AGE2 两个模型中,年龄有没有效果,只有
43、在两个方面上的参数是零。7.2(i)若CIGS = 10 =.0044(10)=0.044 ,这意味着约 4.4,低出生体重。(ii)一个白色的孩子估计重约 5.5,其他因素固定的第一个方程。另外, twhite4.23,这是远高于任何常用的临界值。因此,白人和非白人的婴儿之间的差异也是显着性。(三)如果母亲有一年以上的教育,孩子的出生体重估计要高出 0.3。这是一个巨大的效果,t 统计量只有一个,所以它不是统计学意义。(四)两个回归使用两套不同的观察。第二个回归使用较少的观测,因为 motheduc 或fatheduc 中缺少的一些意见。使用相同的观测,用于判断第二个方程,我们将不得不重新估
44、计第一个方程(取得的 R-平方) 。7.3(I)的 t 统计 hsize2 是超过四绝对值,所以有非常有力的证据,它属于在方程。我们获得这个找到折返点,这是 hsize 的最大化的价值(其他东西固定):19.3 /(2.19)4.41 。 hsize 的数百毕业班的最佳大小是 441 左右。(二)这是由女性的系数(自黑= 0):非黑人女性 SAT 分数低于非黑人男性约 45 点。 t统计量是约-10.51,所以统计学差异非常显着的。 (非常大的样本大小一定的统计意义) 。(三)由于女性= 0 时,在黑色的系数意味着一个黑人男性的估计 SAT 成绩近 170 点,低于可比的非黑人男性。 t 统计
45、量绝对值超过 13,所以我们很容易拒绝假设,有没有其他条件不变差。(iv)我们插上黑色= 1,女= 1 的黑人女性和黑= 0,女= 1,非黑人女性。因此,不同的是-169.81 + 62.31 =107.50。因为估计取决于两个系数,我们不能构建统计给出的信息。最简单的方法是定义虚拟变量三个四个种族/性别类别,选择非黑人女性为基数组。然后,我们可以得到我们要作为黑人女哑变量系数的 t 统计。7.4(i)本大致差异仅仅是关于实用程序 100 倍系数,或-28.3。的 t 统计量是.283/.0992.86,这是非常统计学意义。()100 EXP(0.283 ) - 1)24.7 ,因此估计的幅度
46、要小一些。(iii )本比例差异为 0.1810.158 = .023,或约 2.3。一个方程,可估计为取得这种差异的标准误差是登录(工资)= + 日志(销售)+ 鱼子+ consprod +实用+反+ U,反为运输行业是一个虚拟变量。现在,基地组是金融,系数直接测量的消费品和金融业之间的差异,我们可以使用 t 统计量 consprod。7.5(一)按照提示,= +(1 - NOPC)+ hsGPA + ACT =(+)NOPC + hsGPA + ACT。对于具体的估计公式(7.6)= 1.26 = .157,所以新的截距是 1.26 + .157 = 1.417。对 NOPC 系数为 -
47、.157。(二)什么也没有发生,R 平方。使用 NOPC 代替 PC 是一种不同的方式,包括在 PC 拥有相同的信息。(三)这是没有意义包括两个哑变量的回归,我们不能持有 NOPC 固定的,而改变 PC。我们只有两个组 PC 保有量的基础上,除了整体拦截,我们只需要包括一个虚拟变量。如果我们试图拦截随着包括我们有完善的多重共线性(虚拟变量陷阱) 。在 3.3 节 - 特别是在周边的讨论表 3.2 - 7.6,我们讨论了如何确定偏差的方向时,一个重要的变量(能力,在这种情况下)的 OLS 估计省略了回归。我们有讨论,表 3.2 严格持有一个单一的解释变量包括在回归,但我们往往忽视其他独立变量的存
48、在,并根据此表作为一个粗略的指南。 (或者,我们可以使用一个更精确的分析问题 3.10 的结果。 )如果能力稍逊的工人更有可能接受培训,然后火车和 u 负相关。如果我们忽略存在 EDUC EXPER的,或至少认为火车和 u 后的净额 EDUC EXPER 的负相关关系,那么我们就可以使用表3.2:OLS 估计(误差项的能力)有一个向下偏见。因为我们认为0 ,我们不太可能得出这样的结论的训练计划是有效的。直观地说,这是有道理的:如果没有选择培训接受了培训,他们会降低工资,平均比对照组。7.7(一)写的人口模型相关(7.29)inlf = + nwifeinc + EDUC + EXPER + e
49、xper2 +年龄+ kidsage6 + U + kidslt6插上 inlf = 1 - outlf 的,并重新排列:1 - outlf + nwifeinc + EDUC + EXPER + exper2 +年龄+ kidsage6 + U + kidslt6或= outlf(1nwifeinc )EDUCEXPERexper2 年龄kidslt6kidsage6U,新的错误来看,U ,具有相同的属性为 u。从这里我们看到,如果我们倒退 outlf 所有的自变量(7.29) ,新的截距是 1.586 = 0.414 和每个斜率系数取时 inlf 是因变量符号相反。例如,新的系数 educ 的0.038 ,而新 kidslt6 系数为 0.262。(ii)本标准误差不会改变。在斜坡的情况下,改变的迹象估计不会改变他们的差异,因此,标准误差不变(但 t 统计量