1、1第 2 章 统计数据的描述练习题2. 解:(1)要求对销售收入的数据进行分组,全部数据中,最大的为 152,最小的为 87,知数据全距为 15287=65;为便于计算和分析,确定将数据分为 6 组,各组组距为 10,组限以整 10 划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87 可能落在最小组之下,最大值 152 可能落在最大组之上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数企业数,也可以用 Excel 进行排序统计(见 Excel 练习题 2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以
2、企业总数 40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。整理得到频数分布表如下:40 个企业按产品销售收入分组表向上累积 向下累积按销售收入分组(万元)企业数(个)频率(% ) 企业数 频率 企业数 频率100 以下100110110120120130130140140 以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计
3、 40 100.0 13. 解:(1)由于两组的平均体重不相等,应通过比较离散系数确定体重差异较大的组:因为女生的离散系数为V= 0.1sx50男生体重的离散系数为V= 0.08sx6对比可知女生的体重差异较大。(2) 男生: = 27.27(磅) ,s = =2.27(磅) ;02.公 斤公 斤 2.5公 斤公 斤女生: = =22.73(磅) ,s = =2.27(磅) ;x.5公 斤公 斤 .公 斤公 斤(3)68% ; (4 )95% 。214 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较
4、为合理。(2)利用 Excel 进行计算,得成年组身高的平均数为 172.1,标准差为 4.202,从而得:成年组身高的离散系数: ;024.17.sv又得幼儿组身高的平均数为 71.3,标准差为 2.497,从而得:幼儿组身高的离散系数: ;.9.35s由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。第四章参数估计(1) 1. 解:已知总体标准差 =5 ,样本容量 n=40,为大样本,样本均值=25,x(1)样本均值的抽样标准差 = = =0.7906xn405(2)已知置信水平 1 =95%,得 =1.96,/2Z于是,允许误差是 E = =1.960.
5、7906=1.5496。n/22. 解:(1)已假定总体标准差为 =15 元,则样本均值的抽样标准误差为 = = =2.1429x4915(2)已知置信水平 1 =95%,得 =1.96,/2Z于是,允许误差是 E = =1.962.1429=4.2000。n/2(3)已知样本均值为 =120 元,置信水平 1 =95%,得 =1.96,x/2Z这时总体均值的置信区间为 =1204.2=n/2Z14.58可知,如果样本均值为 120 元,总体均值 95%的置信区间为(115.8,124.2)元。3. 解:计算样本均值 :将上表数据复制到 Excel 表中,并整理成一列,点击最后数x据下面空格,
6、选择自动求平均值,回车,得到 =3.316667,x计算样本方差 s:删除 Excel 表中的平均值,点击自动求值其它函数STDEV 选定计算数据列确定确定,得到 s=1.60933也可以利用 Excel 进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“(a7-3.316667)2” ,回车,即得到各数据的离差平方,在最下行求总和,得到:=90.652i( x-)再对总和除以 n-1=35 后,求平方根,即为样本方差的值s= = =1.6093。1n2i( -) 90.653计算样本均值的抽样标准误差:已知样本容量 n=36,为大样本,得样本均值的抽样标准误差为 = = =0.2
7、682xns361.09分别按三个置信水平计算总体均值的置信区间: 置信水平为 90%时:由双侧正态分布的置信水平 1 =90%,通过 2 1=0.9 换算为单侧正态分布的置信水平 =0.95,查单侧正态分布表得 =1.64,/Z计算得此时总体均值的置信区间为=3.31671.640.2682=n/2sxZ3.756289可知,当置信水平为 90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)小时; 置信水平为 95%时:由双侧正态分布的置信水平 1 =95%,得 =1.96,/2Z计算得此时总体均值的置信区间为=3.31671.960.2682=n/2sxZ3.847910可知
8、,当置信水平为 95%时,该校大学生平均上网时间的置信区间为(2.79,3.84)小时; 置信水平为 99%时:若双侧正态分布的置信水平 1 =99%,通过 2 1=0.99 换算为单侧正态分布的置信水平 =0.995,查单侧正态分布表得 =2.58,/Z计算得此时总体均值的置信区间为=3.31672.580.2682=n/2sxZ4.087266. 解:已知样本容量 n =200,为大样本,拥有该品牌电视机的家庭比率 p =23%,4拥有该品牌电视机的家庭比率的抽样标准误差为= = =2.98%p(1)n0.237双侧置信水平为 90%时,通过 2 1=0.90 换算为单侧正态分布的置信水平
9、=0.95,查单侧正态分布表得 =1.64,/Z此时的置信区间为 =23%1.642.98%=(1)pn/2 27.89%1可知,当置信水平为 90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11%,27.89%) 。双侧置信水平为 95%时,得 =1.96,/2Z此时的置信区间为 =23%1.962.98%=(1)pn/ 28.40%1759可知,当置信水平为 95%时,拥有该品牌电视机的家庭总体比率的置信区间为;(17.16%,28.84%) 。7. 解: 已知总体单位数 N=500,重复抽样,样本容量 n =50,为大样本,样本中,赞成的人数为 n1=32,得到赞成的比率为
10、p = = =64%13250(1)赞成比率的抽样标准误差为 = =6.788%(1)n.64由双侧正态分布的置信水平 1 =95%,得 =1.96,/2Z计算得此时总体户数中赞成该项改革的户数比率的置信区间为= 64%1.966.788%=()pn/2Z7.304%569可知,置信水平为 95%时,总体中赞成该项改革的户数比率的置信区间为(50.70%,77.30%) 。(2)如预计赞成的比率能达到 80%,即 p=80%,由 =6.788%,即 =6.788%(1)pn0.82n得样本容量为 n = = 34.72 取整为 35,2.(67%)即可得,如果小区管理者预计赞成的比率能达到 8
11、0%,应抽取 35 户进行调查。513. 解:已知总体比率 =2%=0.02,由置信水平 1-=95%,得置信度 =1.96,允许 /2Z误差 E 4%即由允许误差公式 E= 整理得到样本容量 n 的计算公式:/2Znpn= = = =47.05962()E/P2()/1-2E/(1-)20.9846由于计算结果大于 47,故为保证使“”成立,至少应取 48 个单位的样本。14. ?解:已知总体标准差 =120,由置信水平 1-=95%,得置信度 =1.96,允许x/2Z误差 E 20即由允许误差公式 E= 整理得到样本容量 n 的计算公式:/2Znxn= =138.29762()E/xZ2(
12、)01.96由于计算结果大于 47,故为保证使“”成立,至少应取 139 个顾客作为样本。第 6 章 假设检验 练习题 (全免)6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了” ,所以原假设与备择假设应为: , 。1035:0H1035:6.2 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于 60 克,但检验结果却提供证据支持店方倾向于认为其重量少于 60 克;(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于 60 克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;(3)连锁店的顾客们自然看重第二类错误
13、,而供应商更看重第一类错误。第七章4. 解:(1)利用 EXCEL 制作数据散点图:将已知表格的后两列复制到 Excel 中,选择该表格后,点击:图表向导 XY 散点图确定,即得散点图如下:00.20.40.60.811.21.465 70 75 80 85航 班 正 点 率 (%)投诉率(次/10万名乘客)6(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,说明航班整点率与投诉率两者之间,存在着一定的负相关关系。利用 Excel 的统计函数“CORREL”计算得到相关系数 r= 0.88261,属于高度负相关(3)求投诉率依赖航班正点率的估计的回归方程设投诉率为 Y,航
14、班正点率为 X建立回归方程 ii21解法一:应用 Excel 函数计算:应用统计函数“SLOPE”计算直线斜率为: =0.070412应用统计函数“INTERCEPT”计算直线与 y 轴的截距为: = 6.0178321解法二:应用 Excel 列表计算:作出 Excel 运算表格如下:航班正点率(%)投诉率(次/10 万名乘客)航空公司名称x yx2 xy西南(Southwest)航空公司 81.8 0.21 6691.24 17.178大陆(Continental)航空公司 76.6 0.58 5867.56 44.428西北(Northwest)航空公司 76.6 0.85 5867.5
15、6 65.11美国(US Airways)航空公司 75.7 0.68 5730.49 51.476联合(United)航空公司 73.8 0.74 5446.44 54.612美洲(American)航空公司 72.2 0.93 5212.84 67.146德尔塔(Delta)航空公司 71.2 0.72 5069.44 51.264美国西部(Americawest)航空公司 70.8 1.22 5012.64 86.376环球(TWA)航空公司 68.5 1.25 4692.25 85.625合 计 667.2 7.18 49590.46 523.215得回归系数为: 222)nxy953
16、.167.18402( )= = 0.07041448.初始值 = yx12yxn2= =6.017837.867.0.4199于是得回归方程为6.1.i iYX7(4)参数的经济意义是:航班正点率每提高一个百分点,相应的投诉率(次/10 万名乘客)下降 0.07。(5)航班按时到达的正点率为 80%时,估计每 10 万名乘客投诉的次数可能为: (次/10 万) 4187.07.018.6iY第八章 时间序列分析练习题1. 解:设 i 年的环比发展水平为 x i,则由已知得:x 200330,(1)又知: , ,求 x20083204520631%xA( ) 22078615%xA( )由上得
17、 3220807283()()xx即为 ,从而 2008 年该厂汽车产量将达到22081.65得 x200830 = 301.3131 = 39.393(万辆)30从而按假定计算,2008 年该厂汽车产量将达到 39.393 万辆以上。(2)规定 , ,求2013x 2043 1+7.8 920134x由上得 9201492043x 9.781.%可知,2004 年以后 9 年应以 7.11的速度增长,才能达到 2013 年汽车产量在2003 年的基础上翻一番的目标。(3)设:按每年 7.4%的增长速度 n 年可翻一番,则有 2013.74na所以 (年)1.074log0.31l 9.703
18、.4可知,按每年保持 7.4%的增长速度,约 9.71 年汽车产量可达到在 2003 年基础上翻一番的预定目标。原规定翻一番的时间从 2003 年到 2013 年为 10 年,故按每年保持 7.4%的增长速度,能提前 0.29 年即 3 个月另 14 天达到翻一番的预定目标。3. 解:设 i 年的环比发展水平为 x i,则已知的三段年均增长率表示为:8,即19301932%x319302x( ),即77193 47193( ),即202078x32078x( )(1) 该地区国内生产总值在这 10 年间的发展总速度为=209x343(1%)(10)(%)2.5917.2%则平均增长速度为:10
19、.57.98.(2) 若 x2000=500 亿元,以后平均每年增长 6,即由 20201%得到 x2002= (亿元) ,25(6)5.80可知,若 2000 年的国内生产总值为 500 亿元,以后平均每年增长 6,到2002 年可达 561.80 亿元。(3) 若 2002 年的国内生产总值的计划任务为 570 亿元,一季度的季节比率为105,则 2002 年各季度的平均计划任务是 5704 亿元,于是,2002 年一季度的计划任务为:(亿元) 。142.50%149.6254. 解: (1) *用移动平均法预测该公司下一年的收益:在 Excel 中作出 10 年间股票的每股收益表,添加
20、“五项平均”计算列,选定“五项平均”列中的第三行单元格,点击菜单栏中“”符号右边的小三角“” ,选择点击:自动求和平均值,用鼠标选定前五个数据(b2:b6),回车,即得到第一个五项平均值“0.96”。选择第一个五项平均“0.96”所在的单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列倒数第三行的单元格处放开,即得到用五项移动平均法计算的趋势值,如下表:年序 每股收益 五项平均1 0.64 2 0.73 3 0.94 0.964 1.14 1.1395 1.33 1.326 1.53 1.477 1.67 1.668 1.68 1.909 2.10 10 2
21、.50 再利用上表的计算结果预测第 11 年的每股收益:选定上 Excel 表中的全部预测值,并将鼠标移动到该选定区域的右下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列第 11 年对应的单元格处放开,即获得 911 年的预测值(见下表蓝色数字),即得第 11 年的每股收益额为“2.30” 。如下表: 年序 每股收益 五项平均1 0.64 2 0.73 3 0.94 0.964 1.14 1.135 1.33 1.326 1.53 1.477 1.67 1.668 1.68 1.909 2.10 1.9910 2.50 2.092.30*用趋势方程法预测该公司下一年的收益:先求出 10 年
22、间股票每股收益的趋势(回归) 方程。设时间为 t,每股收益为 y,趋势方程为 y= 1+ 2 t解法一:应用 Excel 统计函数进行计算:应用统计函数“SLOPE”计算直线斜率:在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“”右边的“”后,选择“其它函数” ,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“” ,选择“统计” ,再在“选择函数(N)” 中选择函数“SLOPE” ,然后点击“确定” ;在“函数参数”窗口中,点击“Known_ys”输入栏后,在 Excel 表中刷取 y列数据,再点击“Known_xs”输入栏后,在 Excel 表中刷取 t 列数据,然
23、后点击“确定” 。这时即在选定的单元格中出现直线斜率的计算结果 0.192848 2应用统计函数“INTERCEPT”计算直线与 y 轴的截距直线起点值:在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“”右边的“”后,选择“其它函数” ,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“” ,选择“统计” ,再在“选择函数(N)” 中选择函数“INTERCEPT ”,然后点击“确定” ;在“函数参数”窗口中,点击“Known_ys”输入栏后,在 Excel 表中刷取 y列数据,再点击“Known_xs”输入栏后,在 Excel 表中刷取 x 列数据,然后点击“确定” 。
24、10这时即在选定的单元格中出现直线斜率的计算结果 0.3653331解法二:应用最小二乘法,用 Excel 列表计算趋势方程的公式元素:年序 每股收益t y t2 ty1 0.64 1 0.642 0.73 4 1.463 0.94 9 2.824 1.14 16 4.565 1.33 25 6.656 1.53 36 9.187 1.67 49 11.698 1.68 64 13.449 2.10 81 18.910 2.50 100 25合计 55 14.26 385 94.34可得:回归系数 222)ntyt1094.351.682()59.01284初始值 = yt12ytn2= =0
25、.3653364.650.1984于是,得每股收益倚年份序号的趋势方程为: 0.365.19tYt对趋势方程代入 t=11,可预测下一年 (第 11 年)的每股收益为:元48.21(2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长 0.193元。是一个较为适合的投资方向第 10 章 统计指数练习题1. 解:设销售量为 q,价格为 p,则价值量指标、数量指标、质量指标三者关系为:销售额=销售量价格11qp = q p于是,对已知表格标注符号,并利用 Excel 计算各综合指数的构成元素如下:销售价格销售量(公斤)(元 /公斤)基期 计算期 基期 计算期品种q0 q1 p0
26、p1q0p0 q0p1 q1p0 q1p1白菜 550 560 1.6 1.8 880 990 896 1008黄瓜 224 250 2 1.9 448 425.6 500 475萝卜 308 320 1 0.9 308 277.2 320 288西红柿 168 170 2.4 3 403.2 504 408 510合 计 1250 1300 2039.2 2196.8 2124 2281于是代入相应公式计算得:用拉氏公式编制总指数为:四种蔬菜的销售量总指数 102410.6% ,39.qpL四种蔬菜的价格总指数 0187p 用帕氏公式编制总指数:四种蔬菜的销售量总指数为 1028103.%
27、96.qpP四种蔬菜的价格总指数为 107.4p 比较两种公式编制出来的销售量总指数和价格总指数,可见:拉氏指数帕氏指数在经济意义上,拉氏指数将同度量因素固定在基期。销售量总指数说明消费者为保持与基期相同的消费价格,因调整增减的实际购买量而导致实际开支增减的百分比;价格总指数说明消费者为购买与基期相同数量的四种蔬菜,因价格的变化而导致实际开支增减的百分比。帕氏指数将同度量因素固定在计算期。销售量总指数说明消费者在计算期购买的四种蔬菜,因销售量的变化而导致实际开支增减的百分比;价格总指数说明消费12者在计算期实际购买的四种蔬菜,因价格的变化而导致实际开支增减的百分比。3. 解:设产量为 q,单位
28、成本为 p,销售价格为 r,则价值量指标、数量指标、质量指标三者关系为:产值=产量价格 , 总成本=产量单位成本qr = q r , qp = q p*以单位产品成本 p 为同度量因素,编制该企业的帕氏产量指数 Pq: 选择已知表格中的单位产品成本和产量数据,标注符号,并利用 Excel 计算帕氏产量指数的构成元素如下:产 量基期 计算期 计算期单位成本产品 计量单位q0 q1 p1q0p1 q1p1A 件 270 340 50 13500 17000B 台 32 35 800 25600 28000C 吨 190 150 330 62700 49500合计 101800 94500于是,以单
29、位产品成本为同度量因素,编制该企业的帕氏产量指数为 109452.83% qpP*以销售价格 r 为同度量因素,编制该企业的帕氏产量指数 Pq再选择已知表格中的价格和产量数据,标注符号,并利用 Excel 计算帕氏产量指数的构成元素如下:产 量基期 计算期 计算期销售价格产品 计量单位q0 q1 r1q0r1 q1r1A 件 270 340 65 17550 22100B 台 32 35 1000 32000 35000C 吨 190 150 400 76000 60000合计 125550 117100于是,以价格为同度量因素,编制该企业的帕氏产量指数为10793.2% 5qrP 比较说明两
30、种产量指数不同的经济分析意义:以单位产品成本为同度量因素编制的该企业的帕氏产量指数说明,按计算期计算的三种产品,因产量的变化而导致总成本增减的百分比。13以销售价格为同度量因素编制的该企业的帕氏产量指数说明,按计算期计算的三种产品,因产量的变化而导致总产值增减的百分比。4. 解:设销售量为 q,价格为 p,则个体价格指数为 ip,销售额指标、销售量指标、价格指标三者关系为:销售额=销售量价格qp = q p 求用基期加权的算术平均指数公式编制四种蔬菜的价格总指数:用基期加权的算术平均价格指数为 0qpiA作 Excel 表格计算公式元素:基期销售额(元)个体价格指数(%)品 种q0p0 ipi
31、pq0p0白 菜 880 112.5 990黄 瓜 448 95 425.6萝 卜 308 90 277.2西红柿 403.2 125 504合 计 2039.2 2196.8用基期加权的算术平均价格指数为:;%73.102.9860qpiA 用计算期加权的调和平均指数公式编制四种蔬菜的价格总指数用计算期加权的调和平均价格指数公式为 ppiqH1作 Excel 表格计算公式元素:计算期销售额(元)个体价格指数(%)品 种q1p1 ipq1p1/ip白 菜 1008 112.5 896黄 瓜 475 95 500萝 卜 288 90 320西红柿 510 125 408合 计 2281 2124即得用计算期加权的调和平均价格指数为:14%39.1072481piqH 用基期加权的几何平均指数公式编制四种蔬菜的价格总指数(课本无此内容) 007.1pqGi