1、1实验一 一元线性回归方程1.下表是中国 2007 年各地区税收 和国内生产总值 GDP 的统计资料。Y单位:亿元地区 Y GDP 地区 Y GDP北 京 1435.7 9353.3 湖 北 434.0 9230.7 天 津 438.4 5050.4 湖 南 410.7 9200.0 河 北 618.3 13709.5 广 东 2415.5 31084.4 山 西 430.5 5733.4 广 西 282.7 5955.7 内蒙古 347.9 6091.1 海 南 88.0 1223.3 辽 宁 815.7 11023.5 重 庆 294.5 4122.5 吉 林 237.4 5284.7 四
2、 川 629.0 10505.3 黑龙江 335.0 7065.0 贵 州 211.9 2741.9 上 海 1975.5 12188.9 云 南 378.6 4741.3 江 苏 1894.8 25741.2 西 藏 11.7 342.2 浙 江 1535.4 18780.4 陕 西 355.5 5465.8 安 徽 401.9 7364.2 甘 肃 142.1 2702.4 福 建 594.0 9249.1 青 海 43.3 783.6 江 西 281.9 5500.3 宁 夏 58.8 889.2 山 东 1308.4 25965.9 新 疆 220.6 3523.2 河 南 625.0
3、 15012.5 要求,运用 Eviews 软件:(1) 作出散点图,建立税收随国内生产总值 GDP 变化的一元线性回归方程,并解释斜率的经济意义;解:散点图如下:得到估计方程为: 0.740.6293yx2这个估计结果表明,GDP 每增长 1 亿元,各地区税收将增加 0.071047 亿元。(2) 对所建立的回归方程进行检验;解:从回归的估计的结果来看,模型拟合得较好。可决系数 ,表明各地20.763R区税收变化的 76.03%可由 GDP 的变化来解释。从斜率项的 t 检验值看,大于 5%显著性水平下自由度为 的临界值 ,且该斜率满足29n0.25(9).t00.0710471,表明 20
4、07 年,GDP 每增长 1 亿元,各地区税收将增加 0.071047 亿元。(3) 若 2008 年某地区国内生产总值为 8500 亿元,求该地区税收收入的预测值及预测区间。解:由上述回归方程可得地区税收收入的预测值: 0.7148501.62935.Y下面给出税收收入 95%置信度的预测区间:由于国内生产总值 X 的样本均值与样本房差为()891.26()5782314EVarX于是,在 95%的置信度下, 的预测区间为0()Y209.673593.2041215734.6或 (47.8,)当 GDP 为 8500 亿元时地区的税收收入的个值预测值仍为 593.3。同样的,在95%的置信度
5、下,该地区的税收收入的预测区间为 2276031(85091.6)593.43)734.或(-47.7,1234.3) 。2. 为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:年 份 地方预算内财政收入 Y(亿元)国内生产总值(GDP)X(亿元)31990 21.7037 171.66651991 27.3291 236.66301992 42.9599 317.31941993 67.2507 449.28891994 74.3992 615.19331995 88.0174 795.69501996 131.7490 950.04461997 144.7709 1130
6、.01331998 164.9067 1289.01901999 184.7908 1436.02672000 225.0212 1665.46522001 265.6532 1954.6539资料来源:深圳统计年鉴 2002 ,中国统计出版社解:(1)建立深圳地方预算内财政收入对 GDP 的回归模型;得到回归方程: 0.134582.615yx(2)估计所建立模型的参数,解释斜率系数的经济意义;X 的系数为 0.314582,常数项为 -3.611151。说明深圳市国内生产总值每增加 1 亿元,地区税收增加 0.134582 亿元。(3)对回归结果进行检验;从回归估计的结果看,模型拟合得较好
7、。可决系数 R2=0.991810,表明地方预算内财政收入变化的 99.18%可由国内生产总值的变化来解释。从斜率项的 t 检验看,4大于 5%显著性水平下自由度为 n-2=10 的临界值 ,且斜率值满足0.25(1).8t00.1351,表明在深圳,国内生产总值每增加 1 亿元,地方预算内财政收入增加0.134582 亿元。(4)若是 2005 年的国内生产总值为 3600 亿元,确定 2005 年财政收入的预测值和预测区间( )。0.5由上述回归方程可得财政收入的预测值为: 0.13482.615480.YX下面给出财政收入的 95%的置信区间。由国内生产总值 GDP 的样本均值与样本方差
8、为:()97.5E()3.Var于是在 95%的置信区间下,E(Y 0)的预测区间为: 260917.5846.381480.22239.7或 (56.1,)当国内生产总值为 3600 亿元时财政收入的个值预测值仍为 480.884。同样的,在95%的置信度下,该地区的税收收入的预测区间为 2360917.584567.381480.9222或(451.0215,510.7785) 。3. 表中是 16 支公益股票某年的每股帐面价值和当年红利:公司序号 帐面价值 (元) 红利(元) 公司序号 帐面价值 (元) 红利(元)1 22.44 2.4 9 12.14 0.802 20.89 2.98
9、10 23.31 1.943 22.09 2.06 11 16.23 3.004 14.48 1.09 12 0.56 0.285 20.73 1.96 13 0.84 0.8467819.2520.3726.431.552.161.6014151618.0512.4511.331.801.211.07根据上表资料: 解:(1)建立每股帐面价值和当年红利的回归方程;5得到回归方 程:0.7286.4975yx(2)解释回归系数的经济意义;从回归方程得知,当当年红利每增加 1 元时,账面价值增加 0.072876 元。(3)若序号为 6 的公司的股票每股帐面价值增加 1 元,估计当年红利可能为多
10、少?由上述回归方程可得该区的税收的预测值为: 0.7286(19.5)0.4795.Y下面给出当年红利的 95%的置信区间。由账面价值的样本均值与样本方差为:().EX().261VarX于是在 95%的置信区间下,E(Y 0)的预测区间为: 2.754.311.92660910或 (.5386,.)当账面价值为 1 元时当年红利的个值预测值仍为 1.94。同样的,在 95%的置信度下,该地区的税收收入的预测区间为 21.6754.3.92609或 。(0.681,3.)4. 美国各航空公司业绩的统计数据公布在华尔街日报 1999 年年鉴 (The Wall Street Journal Al
11、manac 1999)上。航班正点到达的比率和每 10 万名乘客投诉的次数的数据如下 1。航空公司名称 航班正点率(% ) 投诉率(次/10 万名乘客)1资料来源:(美)David R.Anderson 等商务与经济统计 ,第 405 页,机械工业出版社6西南 (Southwest)航空公司 818 021大陆(Continental)航空公司 766 058西北(Northwest)航空公司 766 085美国 (US Airways)航空公司 757 068联合(United)航空公司 738 074美洲 (American)航空公司 722 093德尔塔(Delta)航空公司 712 0
12、72美国西部(Americawest)航空公司 708 122环球(TWA)航空公司 685 125解:(1)画出这些数据的散点图(2)根据散点图。表明二变量之间存在什么关系?根据散点图,表明二变量之间存在线性关系(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程。得方程 0.741.07832yx7(4)对估计的回归方程的斜率作出解释。X 的系数为-0.070414,常数项为 6.017832。正点率每增加 1%,投诉率就减少0.070414 次、10 万乘客。(5)如果航班按时到达的正点率为 80%,估计每 10 万名乘客投诉的次数是多少?如果航班按时到达的正点率为 80%,
13、由上述回归方程可得每 10 万名乘客投诉的预测次数是: 0.7416.07832.4YX下面给出投诉率的 95%的置信区间。由正点率的样本均值与样本方差为:().E()1.5Var于是在 95%的置信区间下,E(Y 0)的预测区间为: 28074.3.18370.38472.65929165或 (.15,.)同样的,在 95%的置信度下,投诉率的个值预测区间为 28074.130.183710.38472.6592965或(-0.0619,0.8313) 。5. 研究青春发育与远视率(对数视力)的变化关系,测得结果如下表: 年龄(岁) x远视率(%) y对数视力 Y=ln y6 63.64 4
14、.1537 61.06 4.1128 38.84 3.6599 13.75 2.62110 14.50 2.67411 8.07 2.08812 4.41 1.48413 2.27 0.8214 2.09 0.73715 1.02 0.0216 2.51 0.9217 3.12 1.13818 2.98 1.0928试建立曲线回归方程 = ( = + )并进行计量分析。yabxeYalnbx解:由题意可知建立单对数模型 ls log(y) c x由图可知:x 所对应得 P 值小于 0.05,故ln0.31965.73048yx6. 为研究美国软饮料公司的广告费用 X 与销售数量 Y 的关系,分
15、析七种主要品牌软饮料公司的有关数据 2(见下表)美国软饮料公司广告费用与销售数量品牌名称 广告费用 X(百万美元) 销售数量 Y(百万箱)Coca-Cola Classic 131.3 1929.2Pepsi-Cola 92.4 1384.6Diet-Coke 60.4 811.4Sprite 55.7 541.5Dr.Pepper 40.2 546.9Moutain Dew 29.0 535.67-Up 11.6 219.5分析广告费用对美国软饮料工销售影响的数量关系。解:画出销售销量 Y 对广告费用 X 的散点图如下:2资料来源:(美)David R.Anderson 等商务与经济统计 ,
16、第 405 页,机械工业出版社9由图可得出结论:销售销量 Y 与广告费用 X 存在明显的线性关系,即当广告费用增加时,销售销量也增加,考虑建立两者之间的线性回归方程来描述广告费用对美国软饮料工销售影响的数量关系。从回归估计的结果看,模型拟合得较好。可决系数 R2=0.56774,表明销售销量变化的 95.68%可由广告费用的变化来解释。从斜率项的 t 检验看,大于 5%显著性水平下自由度为 n-2=5 的临界值 ,且斜率值为 14.4,表明广告费用每0.25().71t增加 1 百万美元,销售销量增加 14.4 百万箱。建立的回归方程为: 14.2.78yx7. 表中是中国 1978 年-19
17、97 年的财政收入 Y 和国内生产总值 X 的数据: 中国国内生产总值及财政收入 单位:亿元年 份 国内生产总值 X 财政收入 Y19781979198010813624.14038.24517.84860.31132.261146.381159.931175.791010821983198419851986198719881989199019911992199319941995100619975301.85957.47206.78989.110201.411954.514992.316917.818598.421662.526651.934560.546670.057494.966850.5
18、73452.51212.331366.951642.862004.822122.012199.352357.242664.902937.103149.483483.374348.955218.106242.207407.998651.14数据来源:中国统计年鉴试根据这些数据完成下列问题;(1)建立财政收入对国内生产总值的简单线性回归模型,并解释斜率系数的经济意义;解:在 EVIEWS 中导入数据进行一元线性回归: 0.136857yx其经济学意义是国内生产总值 X 每增长 1 亿元,财政收入增长 0.100036 亿元。11(2)估计所建立模型的参数,并对回归结果进行检验;解:从回归估计的结果
19、看,模型拟合得较好。可决系数 R2=0.991583,表明财政收入变化的 99.16%可由国内生产总值的变化来解释。从斜率项的 t 检验看,大于 5%显著性水平下自由度为 n-2=18 的临界值 ,表明国内生产总值每增加 1 亿0.25(18).t元,财政收入增加 0.071 亿元。(3)若是 1998 年的国内生产总值为 78017.8 亿元,确定 1998 年财政收入的预测值和预测区间( )。0.5解:由上述回归方程可得该区的税收的预测值为: 0.136780.5378620Y下面给出该区税收的 95%的置信区间。由国内生产总值的样本均值与样本方差为:()2.EX()49.VarX于是在 95%的置信区间下,E(Y 0)的预测区间为: 27801.5.1378915.8560.22489246或 (9,)当国内生产总值为 78017.8 亿元时财政收入的个值预测值仍为 8586200。同样的,在 95%的置信度下,财政收入的预测区间为 27801.5.13782915.85620.02489 或(8585700,8586700) 。