1、 第一章:统计量及其分布19.设母体 服从正态分布 N 和 分别为子样均值和子样方差,又设,22nS且与 独立, 试求统计量 的抽样分布.21,Nn n,21 11n解: 因为 服从 分布. 所以1n 21,0而,21Nn2nSn且 与 独立, 所以 分布.2nS1 111 ntSnSn即 服从 分布.1nt20. 是取自二元正态分布 N 的子样,设,nii212, 和 iiinini S1211, 21niiS试求统计量 的分布.niiniiiniir12211221nSrS解: 由于 .21E.,covDnn2121所以 服从 分布 . n2121,0N21 121212 iini iin
2、iiniiiSrS是正态变量,类似于一维正态变量的情况,可证 与 相互独立. ii SrS22, 所以 统计量122121nSrSn22SrS服从 分布.1)2(1212121nSrSn t第二章:估计量1. 设 是来自二点分布的一个子样,试求成功概率 的矩法估计量.n,1 p解: pE3. 对容量为 的子样,求密度函数 n中参数 的矩法估计其 它,02; axaxf3. 对容量为 的子样,求密度函数 中参数 的矩法估计n其 它,02; axaxf量.解: 令 得 .320adxaE3a4. 在密度函数 中参数 的极大似然估计量是什么?10,f矩法估计量是什么?解: (1) niinni xx
3、L1ii10.l1ll 1ni令 , 得 。0lln1inixLniiLx1l由于 故 是 极大似然估计.01ln22LniiLx1l(2) 由 令 得 2E2.1214. 设 为取自参数为 的普哇松分布的一个子样.试证子样平均 和n,1 都是 的无偏估计.并且对任一值niinS122)(也是 的无偏估计.0,2*nS证: 对普哇松分布有 , 从而DE.122* DnSini故 与 都是 的无偏估计. 又2n 112*nSE故 也是 的无偏估计.*S15. 设 为取自正态母体 的一个子样,试适当选择 ,使,1n 2Nc为 的无偏估计.212niiicS解: 由 且 相互独立可知 ,iE2iDn
4、,1从而jiji j21211212 EnncEcSiiiini .2nDi取 时, 为 的无偏估计.12ncS217. 设随机变量 服从二项分布 ,n,10,1xxnPn试求 无偏估计量.2解: 由于 nE2222 11nnED故 从而当抽得容量为 N 的一个子样后,.12的无偏估计为:2.22nNii量.解: 令 得 .320adxaE3a34. 设 是取自正态母体 的一个子样,其中 为已知,证明n,1 2N(i) 是 的有效估计;212iinS(ii) 是 的无偏估计,并求其有效率 .ni1证 由 知, , 又 的密iSn2.2nESnDS422,N度函数为 , 故21xexf 22l1
5、lxf对 求导得: 2242lnf从而 42242 11l EfE, 故 下界为 。422lnL或 RCnn4142是 的有效估计.2nS. 由于i 2221202 dyedxexEii故 , 即 是 的无偏估计. 又E 22212112 nnEnDnii 而 222l f故 CR 下界为 , 的有效率为 。n2876.02n30 .设 是取自具有下列指数分布的一个子样. n,1 其 它,01xexf证明 是 的无偏、一致、有效估计。ni1证: 由于 是 的无偏估计.20dxeEi 又 , 故22202 3xi 2iD从而 , 而.2nD2411lnEfE故 下界为 因此 是 的有效估计.RC
6、,2另外,由契比可夫不等式 02 nDP所以 还是 的一致估计.32. 设 是独立同分布随机变量, 都服从n,1, 则 是 的充分统计量.10,21,; xxf niT1证: 由于 的联合密度为 n,1 ixnxf,1 ,210i取 , 则由因子分解定理知, 是 的充分统计量.,12ixnk1knT33. 设 是独立同分布随机变量,都服从具参数为 的普哇松分布,则 是关n,1 ni1于 的充分统计量. 证: 由于 的联合密度是 n,1 nixnexfi!1 2,0i取 , , 则由因子分解定理知 : 是充分统计量21nxeki12!ixknT第三章:假设检验1 设 取自正态母体 其中 为未知参
7、数, 为子样均值,对检验问题25, )9,(N取检验的拒绝域 : ,0100:HcxC0251:)(试决定常数 c 使检验的显著性水平为 0.05.解:因为 所以 在 成立下 ,) ,( 9N),( 2590H,5.31C35PCP000 )(, 所以 C=1.176.96.1,97.352设子样 取自正态母体 已知,对检验假设),(1n 20),(N的问题,取临界域 .000:,:H01:)(cxCn(i)求此检验犯第一类错误的概率 ,犯第二类错误的概率 ,并讨论它们之间的关系.(ii)设 ,求 时不犯第二类错误的概率.95.,4.,5.200n650解: (i).在 成立下, 0H),(N
8、20,nCnPC000 0 0110CnuCun其中 是 N(0,1)分布的 分位点。在 H1 成立下, , ),( n20nCnP00101 =0100 01uCu 当 增加时, 减少,从而 减少;反之当 减少时,将导致 增加。1u(ii)不犯第二类错误的概率为 1- 。01 0.956.132nu= .746.5.25.64.14,设某产品指标服从正态分布,它的根方差 已知为 150 小时,今由一批产品中随机地抽查了 26 个,测得指标的平均值为 1637 小时,问在 5%的显著性水平下,能否认为这批产品的指标为 1600 小时?解:母体 , 对假设 采用 U检验法,,1502N160:0
9、H在 H0 为真下,检验统计量观察值为 时临界值2.578,0.xu。 由于 , 所以接受 ,.975126u10H即不能否定这批产品指标为 1600 小时5 某电器零件的平均电阻一直保持在 2.64 均方差保持在 0.06 .改变加工工艺后测的100 个零件,其平均电阻为 2.62 ,均方差不变.问新工艺对此零件的电阻有无显著差异?取显著性水平 。01.解:设改变工艺后,电器零件电阻为随机变量 ,则 未知,E。 检验假设 。 26.D64.2:0H从母体中取了容量为 100 子样, 近似服从正态分布,即: 。 106.,2N因而对假设 可采用 u检验计算检验统计量观察值0H, 02.6410
10、3.n0.1,。 由于 。0.95121u 123.u所以拒绝原假设 即改革工艺后零件的电阻一有显著差异。0H6. 有一种新安眠剂,据说在一定剂量下能比某种就旧安眠剂平均增加睡眠时间 3 小时,根据资料用某种旧安眠剂时平均睡眠时间为 20.8 小时,均方差为 1.8 小时,为了检验新安眠剂的这种说法是否正确,收集到一种使用新安眠剂的睡眠时间( 以小时为单位) 为: 26.7, 22.0, 24.1, 21.0, 27.2, 25.0, 23.4试问这组数据能否说明新安眠剂已达到新的疗效? ( )0.5解:设新安眠剂疗效为随机变量 ,则 未知, 。 E28.1D检验假设 , 8.20:0H8.2
11、0:1从母体中取了容量为 7 子样, 近似服从正态分布,即: 。 7.,2N因而对假设 可采用 u检验计算检验统计量观察值0, 021.340.8.3n0.5,。 由于 。10.9564u 1.7u所以接收原假设 ,即新安眠剂未达到新的疗效。0H15设 X1,X2,- ,Xn 为取自总体 X 的简单随机样本,其中 0 为已知常数,20,N选择统计量 U = ,求 的 1- 的置信区间。210ii 2解:由于 U = 服从 (n), 于是210niiX220211niiXn故 的 1- 的置信区间 。222001122,ni ii iX16在某校的一个班体检记录中,随意抄录 25 名男生的身高数
12、据,测得平均高为170 厘米, (修正)标准差为 12 厘米,试求该班男生的平均身高 和身高标准差 的 0 .95置信区间(假设身高近似服从正态分布) 。解:由题设 身高 XN( ) ,n=25, 。2,5.0,12,70SX(1) 先求的置信区间( 未知)取故 置信区间为:0.97512(),()(4).6XUtnttS (170 )=(170-4.94, 170+4.94)=(165.06, 174.94) (2). 6,570,6.251的置信区间( 未知)取22220.975120.25(1)(),()(4)3.64.nSUn故 的 0.95 置信区间为 2 )69.278,0.()4
13、1.2,36.9(的 0.95 置信区间为 .,3978,014在测量反应时间中,一心理学家估计的标准差为 0.05 秒,为了以 95% 的置信度使他对平均反应时间的估计误差不超过 0.01 秒,应取多大的样本容量 n?解:以 X 表示反应时间,则 为平均反应时间,由条件知,样本标准差)(XES=0.05, 用样本均值 估计 当 n 充分大时,统计量 近似服从标. nXSU05.准正态分布 N(0,1) ,根据条件,要求样本容量满足. 即950.105 nXPXP即20.1.,.64n9.86.04n应取样本容量 n 为 96 或 97。8在某年级学生中抽测 9 名跳远年成绩,得样本均值 =
14、4.38 m . 假设跳远绩XX 服从正态分布,且 = 03, 问是否可认为该年级学生跳远平均成绩为 = 4.40 m ( = 0.10).解:(1) 40.:0H4.:1H(2) 选统计量 (0,);XUNn(3)查标准正态分布表,得出临界值 拒绝域0.951264,uZ);,64.1().,(4)算得, 显然 0.2 不在拒绝域内,因此 H0 被接收,即可,2.03.80U认为该年级学生跳远平均成绩为 4.40 米。9设某次考试的考生成绩服从正态分布,从中随机地抽取 36 位考生的成绩,算得平均成绩为 66.5 分,标准差 Sn*为 15 分,问在显著水平 0.05 下,是否可认为这次考试
15、全体考生的平均成绩为 70 分?并给出检验过程。031.25197.02tnt解:(1)待检假设 备择假设;:H70:1H(2)在 H0 成立条件下选择统计量 1XtnS(3)在显著性水平 0.05 下,查 t 分布表,找出临界值031.25197.02tnt拒绝域 ,(4)计算 ,故接受 H0,,因此可以6.5701.42.031,.3U认为这次考试全体考生的平均成绩为 70 分。11某厂生产的电子仪表的寿命服从正态分布,其标准差为 = 1.6, 改进新工艺后,从新的产品抽出 9 件,测得平均寿命 = 52.8, S*n2 = 1.19 ,问用新工艺后仪表的寿命方X差是否发生了变化?(取显著
16、性水平 = 0.05)解:(!)待检假设 ,备择假设206.1:H216.:H(2)选取统计量 *20Un0成 立 时 2n(3)查 分布表,找出临界值2拒2220.5 0.97512n18., 81.3 绝域为 .,3.7.,(4)计算 ,接受 H0,即改进工艺后仪表寿命的方差没6.19U20有显著变化。12电工器材厂生产一批保险丝,抽取 10 根试验其熔断时间,结果为 :42, 65, 75, 78, 71, 59, 57, 68, 54, 55. 问是否可认为整批保险丝的熔断时间的方差不大于 80 ?(熔断时间服从正态分布,显著性水平 = 0.05).解:(1)待检假设 备择假设,80:
17、20H80:21H(2)选取统计量0*20nnSU在 成 立 下(3)由 查 分布表,91n,05.2221.9n6.(4) 。4.62568577840X12*20S1.9.U370,6.98nii故接受假设 H0,即在 下,可认为整批保险丝的熔断时间的方差不大于 80.5.10某校从经常参加体育锻炼的男生中随机地选出 50 名,测得平均身高 174.34 厘米从不经常参加体育锻炼的男生中随机地选 50 名,测得平均身高 172.42 厘米,统计资料表明两种男生的身高都服从正态分布,其标准差分别为 5.35 和 6.11 厘米,问该校经常参加锻炼的男生是否比不常参加体育锻炼的男生平均身高高些
18、? 05.解: X, Y 分别表常锻炼和不常锻炼男生的身高,由题设2211.6,35.,NX(1) 待检假设 ,备择假设20:H21:H(2) 选取统计量成 立 下在 021mnYXU,(3) 对于 查正态分布表,0.51-0.95Z64(4) 计算 67.50.3.4217U20 故否定假设 即表明经常体育锻炼的男生平均身高比不经常体育锻炼的男生平均身0H高高些。7.14 假设六个整数 1,2,3,4,5,6 被随机地选择,重复 60 次独立实验中出现1,2,3,4,5,6 的次数分别为 13,19,11,8,5,4。问在 5%的显著性水平下是否可以认为下列假设成立:。01:(1)(2)(6
19、)Hpp解:用 拟合优度检验,如果 成立202621()(5)iiinp:列表计算 的观察值:2组数 i 频数 inipiinp2/iiinp123456131911854101010101010391-2-5-60.98.10.10.42.53.6, =11.07215.620.95()由于 ,所以拒绝 。即等概率的假设不成立。20.95()H7.15 对某型号电缆进行耐压测试实验,记录 43 根电缆的最低击穿电压,数据列表如下:测试电压 3.8 3.9 4.0 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8击穿频数 1 1 1 2 7 8 8 4 6 4 1试对电缆耐压数据
20、作分析检验(用概率图纸法和 拟合优度检验) 。2解:用正态概率纸检验出数据基本上服从正态分布,下面 拟合优度检验假2设 20:(,)HN其中 为 和 的极大似然估计,其观察值2,24.37x221()0.48niisx所以要检验的假设0:(4.37,0.82)HN分组列表计算 统计量的观察值。2组 距1ixi频数 in标准化区间1iyi 1()iipyinp2/iiinp4.14.1 4.24.2 4.34.3 4.54.5 4.64.6 5781265-1.25-1.25 -0.79-0.79 -0.34-0.34 0.570.57 1.030.31 0.10560.10870.15260.
21、34880.13280.15154.54084.67416.561814.99845.71046.51450.04641.15740.21520.59940.01470.3521221().485niip用 查表 由于 ,所以不能否定正态0.220.90.9(6)(3)6.120.9(3)分布的假设。7.16 用手枪对 100 个靶各打 10 发,只记录命中或不命中,射击结果列表如下命中数 :0 1 2 3 4 5 6 7 8 9 10ix频 数 : 0 2 4 10 22 26 18 12 4 2 0if在显著水平 下用 拟合优度检验法检验射击结果所服从的分布。.52解 对每一靶打一发,只记
22、录命中或不命中可用二点分布描述,而对一个靶打十发,其射击结果可用二项分布 来描述,其中 未知,可求其极大似然(;10,)bKpp估计为 10.5ixfx设 是十发射击中射中靶的个数,建立假设 10010:()(.5),10KHpk用 拟合优度检验法列表如下:2iinipinp2/iiinp01234567891002410222618124200.0009770.0097650.0439450.1171880.2052120.2460940.2052120.1171880.0439450.0097650.0009770.0980.9764.39511.71920.52124.60920.521
23、11.7194.3950.9760.0980.0981.0740.0360.2520.1070.0790.3100.0070.0361.0740.0982102()3.17iinp取 , =0.520.95()20.95()6.由于 ,所以接受 。2.)H7.17 在某细纱机上进行断头率测定,试验锭子总数为 440,测得断头总次数为292 次只锭子的断头次数纪律于下表。问每只锭子的纺纱条件是否相同?每锭断头数 0 1 2 3 4 5 6 7 9锭数(实测) 263 112 38 19 3 1 1 0 3 解:如果各个锭子的纺纱条件元差异,则所有锭子断头次数服从同一个普哇松分布,所以问题是要检验
24、每只锭子的断头数 。其中 未知,求其极(;)pK:大似然估计为 ,建立假设 ,由 拟合优度290.64x0.6H2检验。列表i断头数 Kinipinp2/iiinp1234501234-8268112381980.51690.34110.11260.02470.0047227.41150.0949.5310.8972.0685.5689.6682.6846.02617.0162520()40.96iinp取 , = ,0.520.95(1)2.95(3)7.81取 , =. 0.4由于 ,所以拒绝 。即认为每只锭子纺纱条件不相同。20.9(3)H第四、五章:线性回归与方差分析1. 若一元线性回
25、归的模型为: 210 ,0,1, Nnixy iii 试求参数 的最小二乘估计,其中 不全相同。10,i解:由最小二乘法知要最小化函数 ni iixyQ12100,得正规方程组为:.1,0,10iQiiii yx120解之得参数 的最小二乘估计为:10,xyyii10212. 设有四个物体 A、B、C、 D,其重量分别为 、 、 、 ,四次在天平上秤重得:234y1= + + + + ; y2= + - - + ;23411234Y3= - + - + ; y4= - - + + .123431234其中 、 、 、 分别表示秤重时发生的随机误差。求 、 、 、 最小二乘12 1234估计。解
26、: Y=11X4321y,40X 43214321yyYX.432143214321yyy3.为研究三种不同教材的质量,抽取三个实验班分别使用其中一种教材,而对其他因素加以控制,现每班随机抽取五人,测得平均分为 71,75,70,求得总偏差平方和 SST=192,试分析三种教材质量有没有显著性差异。 (已知 F0.05(2,12)=3.88).解:(1) 707-52715SA,30x 22。9E(2)确定自由度:df A=3-1=2; dfT=15-1=14; dfE=15-3=12.(3)求均方: MSE=;320M1.2(4)进行 F-检验: 83,4.17.505.FSEF故 不能拒绝
27、 H0,即三种教材质量无显著性差异。4. 随机抽取 20 名学生进行测试,将其随机分成 4 组,每组 5 人,各组分别随机地接受一种自学辅导方案,结果如下表。问四种自学辅导方案的效果是否一致?(已知 )0.93,165.29自学辅导方案 A B C D每组人数 jn 5 5 5 5每组平均数 jX 79 75.4 81 77.2每组方差 2jS 4 2.8 3 3.5解:建立原假设 H0: DCBA由 15.7842.1.7594BAt XX0.6,.861212 kjkjtj SnEnS故 .45.,5.4. EA dfMSdfM0.928.6.3,16.291SFFE故 拒绝 H0,即四种自学辅导方案存在显著差异。