1、复旦大学社会统计学习题集 第一部分 统计描述 比例、比率、百分比、统计图表 集中趋势和离散趋势 第二部分 统计推断 分布与概率 抽样 参数估计和假设检验(单样本) 双样本和多样本的假设检验 两变量间的相关的测量和假设检验 简单线性回归 曲线和二元线性方程(附加题) 第三部分 补充习题 整理人:志者同航,复旦大学社会学系在读研究生。 Email:W QQ: 42103301 Homepage: http:/ 我的博客: http:/ 考研交流班:http:/ 内部资料 2007年4月20日 1第一部分 统计描述 比例、比率、百分比、统计图表 1、 分布和统计表、统计图的关系如何? 2、 频次和
2、频率有何不同? 3、 设下面的表格表示某大学参加社会活动和学生年级之间的关系: 级别 参加教会活动 一年级 二年级 三年级 四年级 合计 经常 83 71 82 59 259 不经常 31 44 61 78 214 合计 114 115 143 137 509 试求: a,在总体样本中经常参加者的百分比是多少? b,一年级对四年级的比率是多少? c,经常参加者中一二年级对三四年级的比率是多少? d,四年级中不参加活动者的比例是多少?不经常参加者中四年级的比例是多少? e,一二年级中不经常参加活动者的人数是否多于三四年级(用)。 4 、社会心理学家研究工业生产率与群体领导之间的关系。以下资料表明
3、三个领导群组中个人的生产率水平: 群体领导类型 生产率 民主 自由 专断 合计 高 37 36 13 86 中 26 12 71 109 低 24 20 29 73 合计 87 68 113 268 a 向哪个方向计算百分比更适宜?为什么? b 计算百分比并简略总结资料。 c 在每一组中,高对低的生产率的比率是多少,三个比率是否可以足够概括资料?请解释。 5、某一街区中工人对农民的比率是8/5,农民的比率是多少?假如工人对知识分子的比率是8/5,是否可以用同样方法获得知识分子的比例?为什么? 6、设一城市1960年有人口153468,1970年为176118,1960年到1970年间的增长率是
4、多少? 7、某一地区有 12160个男人和11913个女人,其性比率是多少(每100个女性中对应的男性数)? 8、某国1992年的GDP为10亿美元,本来预估计次年的GDP会达到11亿美元,可结2果却只达到10.5亿美元。在一次国家经济会议上,负责经济的官员称,那一年的GDP目标实现率为95.4,其计算公式为(实现的GDP/预定的GDP)*10010.5/11.0*10095.4 你认为这种算法有没有问题? 9、据统计,有一家出版公司去年的单位生产成本增加了12,而产品的销售价格只增加了8,所以该公司声称其去年的利润减少了4。你对此说法有何意见? 集中趋势和离散趋势 1、 试举例说明变量测量层
5、次划分的意义。 2、 为什么低层次的变量不能用高层次变量的集中值和离散值。 3、 试说明算数平均数、几何平均数、中位数和众数这4个集中量数的特点。 4、 中位值和均值在实际中一定存在吗?均值永远是定距变量最合理的集中值吗? 5、 统计关系是否意味着因果关系? 6、 名词解释:数学期望、边际分布、匹配样本。 7、 一组10个男孩和一组7个女孩参加代数考试,男孩的平均分是84,中位数是74,女孩的中位数和平均数相等,均为79。老师认为男孩比女孩的成绩考的好,是否正确?为什么?你怎样解释男孩组平均值和中位数之间的差别? 8、 第一组 50个领导人的平均年龄是21.6,第二组100个领导人的平均年龄是
6、 62.3。第三组435个领导人的平均年龄为44.7,问三组平均年龄是多少?若上述平均值改作中位数,能否用同样方法求得三个领导人总的中位数?为什么? 9、 下列假设资料是60个国家中农民家庭的百分比分布。计算平均值和中位数。 若在下列情况下,指出平均值和中位数所受的影响(增大、减小,保持不变)。 a 最后一个组距扩大到50-69,频数不变。 b 每一组组距增加10,频数不变。 C 组距不变,将20-29组的频数减2并加在下一组的频数中。 d 组距不变,频数加倍。 10、下表是一批25-35岁社会志愿者对象的年龄分布: 年龄 x(岁) 人数f 25 22 26 23 27 35 28 42 34
7、 20 35 34 组距 频数 10-19 7 20-29 16 30-39 21 40-49 12 50-59 4 合计 60 3合计 280 又知道这批人的年龄平方和为253004,年龄加权算术平均数为29.88,求: (1) 这批人年龄的第一四分位数:(提示, 注意年 龄的变量类型) (2) 这批人年龄的方差; (3) 这批人年龄的标准差系数。 第二部分 统计推断 分布与概率 1、 什么是概率? 2、 事件互不相容与相互独立这两个概念之间有何不同? 3、 频率分布和概率分布有何区别和联系? 4、 试述正态分布的性质与特点? 5、 试述正态分布、t分布、卡方分布和F分布的定义及常见用途。
8、6、 超几何分布与二项分布有何区别和联系? 7、 试述x2分布,t分布和F分布的性质。它们之间有何联系? 8、 试述大数定律和中心极限定理的基本思想。 9、 某地区回族占全体居民的6,今随机抽取10位居民,问其中有2名回民的概率试多少? 10、 一个口袋里装有10只球,分别编上号码110,随机地从这个口袋中取3只球,试求:( 1 )最 小号码是5的概率;(2)最大号码是5的概率。 11、 工人中吸烟的比例为0.5,某车间有工人300名。求以下概率:( 1 ) 全 不 吸烟。(2)一人吸烟;(3)二人吸烟;(4)三人吸烟。 12、 假设某年龄组中自杀率是0.003,在一随机抽取的同龄组的1200
9、人中,竟无人自杀。发生这种情况的概率是多少? 13、 某工厂总体的10是技术人员,求7人委员会中4人是技术人员的概率。 14、 设某股民在股票交易中,每次判断正确的概率是 60,该股民最近作了 100 次交易。求至少有50次判断正确的概率。 15、 已知N件产品中有M件不合格,今从中随机地抽取n件。试求:( 1 ) n 件 中 恰 好有 k 件 不合格的概率;(2)在n件中至少有1件不合格的概率。假定kM,n-kN-M。 16、 某社会事物仲裁机构每小时接到48次电话,据此: (1)求其在5分钟内接到3次电话的概率; (2)求其在15分钟内恰好接到10次电话的概率; (3)如果现在没有电话,接
10、线员有3分钟时间休息而不被电话打扰的概率是多少? 17、某车间共有40名工人,其中妇女为10名,今任抽5名进行访问,问被访者至少有4名妇女的概率是多少? 18、问卷调查中,首先问“您是否结婚?”如果回答是未婚,将跳过以下问题不问。如果回答是已婚则进一步询问“您是否有孩子?”设未婚的概率为0.4,已婚中有孩子的概率为0.8,问访问中有孩子的概率是多少? 19、一份试卷上共有 6 道题。某位学生在解答时由于粗心随机地犯了4处错误。试求(1)4这4处错误发生在最后一道题上面的概率;(2)这4处错误发生在不同题上面的概率是多少?(3)至少有3个题全对的概率是多少? 20、设 A、B、C 是三个事件,已
11、知P(A)=P(B)=P(C)=0.3,P(AB)=0.2,P(BC)=P(AC)=0,试求A、B、C中至少有一个发生的概率。 21、一个盒子中装有10只晶体管,其中 3件是不合格产品。现在作不放回抽样:接连抽取两次,每次随机抽取一只。试求下列事件概率。( 1 ) 2 只 都 是合格产品。( 2 ) 1 只是合格品,一只是不合格产品。( 3 )至 少有1只合格产品。 22、在100箱出口商品中,有10箱为乡镇企业的产品,问第三箱才抽到乡镇企业产品的概率是多少?(假定是非重复抽样) 23、5名篮球运动员独立的投篮。每位运动员投篮的命中率都是80。他们各投一次。试求:( 1 ) 恰 有 4 次 命
12、 中的概率。( 2 ) 至 少有4次命中的概率。( 3 )至 多 有 4 次 命 中的概率。 24、一个盒子装有 6 只乒乓球,其中4只是新球。第一次比赛时随机地抽取2只乒乓球,用后放回原处。第二次比赛时又随机取出2只乒乓球。试求第二次取出的球全是新球的概率。 25、在一批10个产品中有4个次品。如果一个接一个的随机抽取2个,下面每个随机事件的概率是多少? (1)抽取的一个是次品,一个是正品。 (2)抽取的2个都是次品。 (3)至少有一个次品被选中。 (4)抽取2个合格品。 26、口袋里面装有ab个硬币,其中 b个硬币是废品,(两面都是国徽)。 从 口 袋中 随机取出一个硬币。把它独立的抛n次
13、,结果发现向上的一面全是国徽,试求这枚硬币是废品的概率。 27、居民楼共有 12 户居民,其中有 9 户为干部,3 户为工人。现从中任抽一户,若抽到的是工人户。则不放回再抽一户。直到抽到干部户为止。试求在抽到干部户之前已抽出的工人户的概率分布、均值、和方差。 28、已知某商店每月销售的电视机X服从参数为10的泊松分布。试问,月初至少应进货多少才能保证当月不脱销的概率不小于0.999。假定上月没有库存,且当月不再进货。 29、已知某厂生产的晶体管的寿命服从均值为100小时的指数分布。现在从该厂的产品中随机地抽取64只。试求这64只晶体管的寿命总和超过7000小时的概率。假定这些晶体管的寿命是相互
14、独立。 30、报童沿街向行人兜售报纸。设每位行人购买报纸的概率为 0.2,且他们是否买报是相互独立的。试求,报童在向100位行人兜售之后,卖掉报纸1530份的概率。 31、某厂有200台车床,每台车床的开工率仅为0.1。设每台车床是否开工是相互独立的,假定每台车床开工时需要50千瓦电力。试问,供电局至少应该向该厂提供多大电力,才能以不低于99.9保证该厂不致因供电不足而影响生产。 32、某商店每月销售某种商品的件数服从参数为4.6的泊松分布,问在月初应购进多少此种商品,才能保证不脱销的概率至少为0.99。(同28题) 533、一家公司在某地区钻探石油,被钻探的油井将被证明产油或无油 。根据地质
15、资料,在该地区钻探的油井中仅有30是产油井。该公司的财力仅能支持10口井的钻探。问: (1)10口井皆产油的概率。 (2)10口井皆无油的概率。 (3)要使该公司的投资有利可图,至少需要有2口油井产油,问该公司盈利的机会有多大? 34、设询问1000个新生的音乐爱好,发现其中有 400个古典音乐的爱好者,在古典音乐爱好者中又有100个“迪斯科”的音乐爱好者,还有400人既不爱好古典音乐,也不爱好迪斯科音乐,其余的爱好迪斯科音乐。 a,如果从以上总体中任抽一个学生,设事件A为爱好古典音乐,设事件B为爱好迪斯科音乐。求P(A),P(B),P(A/B)以及P(B/A)。 b,求证P(AB)=P(A)
16、P(B/A)=P(B)P(A/B)。 c,求某人爱好其中一种而不是两种的概率。 D,一个学生可能有4种爱好,试求从总体中随机选出三个具有共同爱好的概率。 35、一个市场调查公司受雇进行一项调查,查明人们在哪里购买家电,随机选出一组100位顾客中,其中有30位声称他们只去专业商场,60位说他们只去超级市场,10说他们既去专业商场又去超级市场。( 1 ) 去 超 级 市 场 的 顾 客 中 也 去 专业商场的顾客比例是多少?(2)一个人去专业商场而不去超级市场的概率是多少? 36、一个咨询公司提出三条建议供三个客户考虑。假设 3 条建议被接受的机会分别是1/2,1/3和1/4。下述事件的概率是多少
17、? (1)有且只有一条建议被接受?(2)没有建议被接受。( 3 )三条建议全被接受。 37、10户人家中有5户参加财产保险,3户人家参加了人寿保险,其余未参加任何保险,求随机抽查4户中参加财产保险户数、人寿保险户数的概率分布? 38、在 100 家公司的最新调查中,发现 40的公司在大力研究广告效果,50的公司在进行短期销售预测,而 30的公司同时从事这项研究。假设从这100家公司中任选一家,定义事件 A 为该公司在研究广告效果,事件 B 为该公司在进行短期销售预测,试求:P(A),P(B),P(AB),P(A+B),P(A/B),P(B/A)。 39、一个人想从两个缸中随机选择一个,并从已选
18、择的缸中再随机选出一个白球。已知第一个缸中有1/2 白球和1/2黑球,第二个缸中有 2/3 白球和 1/3 黑球,那么此人选出一个白球的概率是多少呢? 40、一人乘公共汽车或地铁上班的概率分别是0.4和0.6,当他乘公共汽车时,有30的日子迟到;当他乘地铁时,有 10的日子迟到。问此人上班迟到的概率是多少?若此人某天迟到,其乘地铁的概率是多少? 41、某产品由甲乙乡镇企业生产,其中甲厂提供95的产品,乙厂提供5的产品,甲厂产品的合格率为95,乙厂产品合格率为70。现抽得一件是次品的情况下,问来自甲厂的概率是多少? 42、一个社会心理学家将12个小组匹配成6对小组,每一对含有一个实验组和控制组。
19、6该心理学家试图通过增加群体聚合力的实验来表明实验组的聚合力高于控制组。问怎样用二项分布的原理去检验实验无效力的零假设?列出检验所需的零假设,计算抽样分布并选择临界域。( 综 合 题 型) 43、在对某饭店的商务活动进行研究发现,在星期一晚上 10点到11点之间到来的顾客人数平均为5人。使用泊松分布回答如下问题: (1)星期一晚上10 11 点之间只有 1 位或 2 位顾客来到的概率是多少? (2)正好有5位顾客到来的概率是多少? (3)超过8位顾客来的概率是多少? 44、某保险公司根据过去发生交通事故的记录估计出1位投保学生在一年内遭遇交通事故概率是0.03。如果随机抽取100位学生投保人,
20、计算在过去的一年里,有 4位学生遭遇交通事故的概率。 45、某校16个学生构成一个样本,对他们进行口试。按他们进入考场的顺序,将成绩记录如下:61,74,70,63,64,58,82,78,60,76,85,72,68,54,62,56。试问该样本在0.05的显著性水平下,是否具有随机性? 46、在一次包括20个地区的政府工作表现考评中,其中3个地区政府的各项表现的10分制评分(分值越高,表现越好),以及 20个地区的政府各项表现的评分均值与标准差的统计结果如下: 地区 尽职尽力 严肃认真 开拓进取 措施合理 高效优质 联系群众 尊重科学 实事求是 廉洁公正 总分 甲 6.9 7.2 6.9
21、8.4 7.4 7.2 8.9 6.5 6.8 66.2 乙 6.5 6.4 6.7 9.0 6.9 7.8 7.2 7.3 7.9 65.7 丙 7.0 6.9 6.3 7.9 7.3 8.6 7.4 7.3 7.0 65.7 平均分 6.8 6.7 6.6 8.2 7.2 8.3 7.6 7.1 6.8 标准差 1.5 1.3 1.7 2.3 1.6 1.2 1.8 1.3 12 试用标准分对以上三地区的政府工作表现作出排序。 47、某公司员工的月工资服从均值为1000元,标准差为100元的正态分布。试计算某员工得到如下工资的概率:( 1 )介 于 950和1300元之间;(2)超过112
22、5元;(3)低于800元。 48、随机变量N(50,25),求P(60)? 49、装配某种特殊机器所花费的时间服从均值为80分钟,标准差为10分钟的正态分布。( 1 )在一个小时或更少的时间内装配完一台机器的概率是多少? (2)在超过60分钟但少于70分钟的时间内装配完一台机器的概率是多少? (3)如果60名工人被安排装配该机器,并要求在最多90分钟内完成。在这一规定的时间内,有多少工人不能完成工作? 50、若一正态分布的平均值为80,标准差是12。求: a,80和93之间频数的比例是多少? b,90和105之间、70和105之间的频数比例是多少? 7c,少于68的频数比例是多少? d,为获得
23、双尾面积为2和10,平均值两侧标准差应各为多少? 51、已知Z满足标准正态分布N(0,1),求以下各值情况下,P(|Z|)中的值:(1)0.1;(2)0.05;(3)0.01 52、根据调查,儿童智商分布为N(100,100),某幼儿园共有儿童100名,问智商在100-120之间的儿童共有多少名?(口算) 53、已知某校三年级学生的社会学成绩服从正态分布,均值为75分,标准差5分。( 1 )现 从 该 年级学生中随机抽取1人,问其社会学成绩在7080分之间的概率有多大?(2)若从该年级学生中随机抽4人,则他们的社会学平均成绩低于70分的概率有多大? 54、在交通工程中需要测定车速(单位:千米/
24、小时)。 由以往的经验知道,测量值服从标准差为3.58的正态分布。假定所有的观测值都是相互独立的。 (1)至少作多少次观测才能以90的可靠性保证平均测量值的误差在1之间?(2)现在作了150次观测,试问平均测量值的误差在1之间的概率? 55、在下列资料中,令事件A为抽得一个男性,事件B为抽得一个有大学文化水平的人,事件C为高度社会歧视态度持有者。 大学文化水平 低于大学文化水平 歧视态度程度 男 女 男 女 高 100 50 200 250 低 150 100 150 200 a, 在不用公式的情况下,找到一个抽样的P(ABC)。证明:P(ABC)的公式。 b, 与a的要求相同,求出P(A+B
25、+C)。 c,求出在三个随机抽样中抽得一个大学文化水平的男子,一个大学文化水平的女子以及一个持有高度歧视态度的人的概率。 56、某大学选修社会学概论的学生,按性别比例及其对职业的展望分类。资料如下: 性别 职业要求高 职业要求低 合计 男 43 10 53 女 71 93 264 合计 114 103 217 假设从总体217中随机抽取学生。 a, 抽取一个职业要求较高的学生概率是多少?若此学生恰好是男生,概率是多少?女生概率是多少? b, 随机抽选学生(无回置),经常抽到职业要求较高学生的概率是多少?职业要求较低的概率是多少?为什么?在217例当中,期望的误差是多少? c, 设学生性别已知,
26、分派53个男生或在职业要求低的类别中的期望误差是多少?对女生的期望误差是多少? 8 抽样 1、“抽样调查是社会科学研究最适用的调查方法。”你如何看待这一表述? 2、什么是简单随机样本?它有何性质? 3、统计推断为什么要研究抽样分布? 4、纽约的一家报纸对一大群醉卧街头或酒吧的20岁以上的男子进行随机访问,发现其中有60的人是已婚的,34的人是未婚的。据此,该报纸称:“据统计,已婚男人中成为醉鬼的比例是单身汉的两倍”您认为如何看待这一说法? 5、1989年,Fortune杂志有一期刊登了这样一份资料: 南韩 台湾 香港 新加坡 人均GDP(美元) 3436 4837 8158 8817 识字率(
27、%) 92 90 88 87 能否据此认为,在四个地区的经济发展水平与人口文化素质间存在负相关关系?请简述主要理由。 6、在美国,曾有这样一则新闻报道:“纽约的吸毒者每年至少要偷窃44-50亿美元的物品,典当销赃之后用于购买毒品”。其估计依据是,全纽约有10万吸毒者,每人每天至少吸毒的开销至少是30美元,所以一年要花去30*100,000*365,约为11亿美元。而这些吸毒者偷窃的物品,一般只能卖真正价值的四分之一,所以为了要支付11 亿美元的毒资,他们必须偷窃到4倍于此的物品。您觉得这一统计是否有问题? 7、美国有一机构,曾经在艰苦地区进行了样本为4500人的抽样调查后发表过一个惊人的发现:
28、“在体重过重的人口中,只有 17的人确实是饮食过量所致,其它83的人其实是饮食不足所致的。”您对这一发现有何看法? 8、有一社区管理部门要从甲乙丙三个社区管理方案中选出一项最受居民支持的方案,为此设计了一个问卷题目,对每个方案都列出“赞成”和“反对”两个选项,并规定每个方案若居民赞成得2分,而反对只能得1分。调查后的统计结果是:甲乙丙三个方案的平均得分是1.8、1.2和0.6。于是社区管理部门决定采用甲方案,理由是“它受居民的支持程度分别是另两个方案的1.5和3倍。”你觉得这一决策或其理由有何不妥? 9、一家社会调查机构想通过随机抽样来估计某地区居民家庭的每月文娱开支占消费指出的比例。若其预定
29、的估计误差不超过 0.05,统计推断的可靠性为 95,则至少应抽调多少户居民?(已知该地共有居民 5000户,公司调查员判断该地居民家庭的每月文娱支出占消费支出的比例不会超过20) 10、某高校有3000名走读学生,该校后勤部门想估计这些学生每天来回的时间。以置信度为 95的置信区间估计,并使估计值处在真值附近 1 分钟的误差范围之内。一个先前抽样的小样本给出的标准差为4.8分钟,试问应抽取多大样本? 11、置信区间总宽度不超过 500元,标准差的估计值是1300元。若建立平均值的99.9置信区间,需要多少样本? 12、一家塑料公司想估计其产品的平均抗拉强度,并想以 95的置信度使估计值在真值
30、的1公斤/平方厘米的范围内。该公司应取多少个样品?经验表明2的估计值可取12.25。 913、若某一居民居住区中住房拥有者的比例近似0.75,那么建立总宽度为0.03的95的置信区间,需要多大的样本?若住房拥有者的比例改为0.5,又需要多大的样本? 14、某调查公司欲了解某居民区内看过某电视广告的家庭所占比重,需要从该区抽选多个家庭作样本。该小区居民共有1050户,分析人员希望以 95的置信度对这个成数作出估计,并使估计值在真正成数附近0.05 范围内,在一个以前的抽取的样本中,有28的家庭看过该广告,试问应抽取多大样本? 15、一家市场调查公司欲估计某城市有电脑家庭所占的比例,该公司希望对p
31、的估计误差不超过0.05,要求置信度为95,则应取多大容量的样本? 参数估计和假设检验(单样本) 1、 如何理解统计推断中的p值? 2、 “在假设检验中,若假定很低的显著性水平,如0.001,则很少会出现检验错误,因此,这是进行假设检验应该遵循的一条原则。”你如何评价这一看法。 3、 试举例说明什么是无偏性?什么是有效性? 4、 为何需要确定合适的样本容量? 5、 试述假设检验的基本思想和一般步骤。 6、 什么是假设检验中的两类错误?试举例说明这两类错误的关系。 7、 人们一般认为95的置信区间代表的是0.05水平上的一组双尾检验。试解释为什么它不表示0.05水平上的双尾检验? 8、 均值检验
32、中,比较标准差已知和未知两种情况下检验运算有何不同? 9、 抽样调查显示,某地居民的户均收入1995年为2500元,1996年为2512元。能否据此认为,该地居民的户均收入在此两年中是增长的?为什么? 10、 如果要你选择两种不同的检验来决定某一零假设和备择假设,两种检验有相同的显著性水平,那么你应当选择误差较小的检验。你是否同意这种说法?为什么?(同2003考研判断第2小题) 11、 设x1,x2,x25取自正态总体N(u,9),其中u为总体未知参数,x为样本均值,如对检验问题:H0: u=u0, H1:uu0,取检验拒绝域:c(x1,x2,x25):|x-u0|c,试确定常数c,使显著性水
33、平为0.05。 12、 某仓库尚有100箱食品,每箱食品均装有10个。今随机抽取10箱检验每箱食变质个数为 2,1,3,0,2,0,1,0,1,1。试求食品变质的成数和总的食品变质个数的的置信度为95的置信区间。 13、 为防止出厂产品缺斤少两,该厂质检人员从当天产品中随机抽取12包过称,称的重量(以 g 为单位)分别是9.9,10.1,10.3,10.4,10.5,10.2,9.7,9.8,10.1,10.0,9.8,10.3。假定重量服从正态分布,试以此数据对该产品的平均重量求置信水平为95的区间估计。 14、 电话咨询服务部门在每次通话结束时都记下通话时间。从一个由 16个记录组成的简单
34、随机样本中得出一次通话的平均时间为1.6分钟,试求总体平均值的置信10度为90的置信区间。已知总体服从标准差为0.7分钟的正态分布。 15、 为了解某村1200户居民的年收入情况,抽 取 一 个由80户组成的简单随机样本,得出每户农民年平均收入为3210 元,标准差为205元。试求该村每户农民年平均收入置信度为95的置信区间。 16、 对方差已知的正态总体,问需要抽取容量n为多大的子样,才能使总体均值u的置信水平为(1)的置信区间的长度不大于L。 17、 某厂负责人欲估计 6000根某零件的长度,随机抽取350根,测验得其平均长度为21.4mm,样本标准差为0.15mm,试求总体均值 u的置信
35、度为 95的置信区间。 18、 随机抽取某种炮弹 9 发试验,测得炮口速度的方差的无偏估计为 s211(米/秒)2 。设炮口速度服从 N(u,2),分别求出这种炮弹的炮口速度的标准差和方差2 的置信水平为90的置信区间。 19、 根据某大学100名学生的抽样调查,每月平均用于书籍购买的费用为45元,标准差为5元,求大学生每月用于购买书籍费用的区间估计(置信度为95)。 20、 某公司由400人组成,其平均工龄为10年,标准差为3年,随机抽样50人组成一个简单随机样本,试问样本中工作人员的平均工龄不低于9年的概率有多大? 21、 为检测某机床的精确度,对其所生产的产品随机抽取10件,测量其直径,
36、根据测得数据,计算样本的标准差为2mm,试求的95的置信区间,构造该区间需要作什么假定? 22、 随机抽取某大学16名在校大学生,了解到他们每月的生活费用平均为800元,标准差s为300元,假定该大学学生的每月生活费用近似服从正态分布,试以95的置信度估计该大学学生的月平均生活费用标准差的置信区间。 23、 某品牌化妆品开发人员欲估计其顾客的平均年龄,随机抽取了16位顾客进行调查,得到样本均值为30岁,样本标准差为8岁,假定顾客的年龄近似服从正态分布,试求该品牌化妆品全部顾客的平均年龄置信度为95的置信区间。 24、 某工厂根据200名青年员工的抽样调查,其中有60参加各种形式的业余学习。求青
37、年参加业余学习比例的区间估计。置信度为90。 25、 某高校在一项关于旷课原因的研究中,从总体中随机抽样选出3200人组成样本,在对其进行问卷调查时,有60人说他们旷课是由于任课教师讲课枯燥。试对由于这种原因而旷课的学生的真正比例构造95的置信区间。 26、 在一个城市社区内随机抽选200个家庭,发现其中36是由丈夫作出超过一半以上的经济决策的。计算这些家庭99的置信区间。 27、 最新一次人口普查表明某市老年人口比重为 15.7,为了检验该数据是否真实,普查机构又随机抽选了400名居民,发现其中有62人年龄在65岁以上,问随机抽样的结果是否支持该市老年人口比重为15.7的假定?a0.05。
38、28、 在一所大学,有人想了解学生戴眼镜的成数。随机抽样选出100名学生。其中戴眼镜的学生有31名。试求全校学生戴眼镜成数的置信度为90的置信区间。 11 29、 根据居民区100户抽样家计调查,居民用于食品费用占总收入的比例,平均为75,比例的标准差为20。求食品费用占居民总收入比例的区间估计。a=0.05. 30、 接上题,如果置信度为99,求区间估计值,并与上题结果比较。 31、 为了解某地居民住房条件而进行调查,得到资料如下:样本n50,户均住房面积为40平米,标准差为9平米。试以95的置信度推断该地居民的户均住房面积。 32、 某糖厂用自动打包机装糖。已知每袋糖的重量(单位:kg)服
39、从正态分布N(u,2 )。今随机抽样调查了9袋,并称出它们的重量x1x2x9,由此算得均值是52kg,标准差是 2.5kg。在下列两种情形下,分别检验 H0:u=50,( H 1 : u 50)取显著性水平a0.05。( 1 ) 2 4 ;( 2 ) 2 未知。 33、 假定某产品重量服从正态分布,今从一批产品中随机抽选18个,测得重量的平均值为820g,标准差为60g,试以0.01的显著性水平检验原假设u800g。 34、 某仓库中有200箱食品,每箱食品均装有100个。今随机抽取20箱进行检查。其每箱食品变质个数如下: 20 17 32 24 23 18 16 12 3 9 6 2 6 1
40、2 20 20 0 1 2 3 试求总的食品变质个数的置信度为95的置信区间。 35、 某厂生产一种新型家用产品,厂家声称某市已有 20以上的家庭使用这种产品。市场调查人员在该市抽选了一个由300个家庭组成的随家样本。发现有 70个家庭使用了这种产品。这些数据是否为证实厂家的说法提供了充分的证据?设a0.05 36、 某公司想从国外引进一种自动加工装置,这种装置的工作温度x服从正态分布N(u,25),厂方说它的平均工作温度是 80 度。从该装置试运转中随机测试 16 次,得到平均温度试83度,该公司考虑,样本结果与厂方所说的是否有显著差异?厂方的说法是否可以接受?设a0.05。 37、 根据居
41、民楼 100 户的抽样调查,居民用于食品的费用平均占总收入的比例为80,标准差为20。问: (1) 有关食品费用占总收入的比例,平均为75的说法能否成立? (2) 如果拒绝了(1)的说法,则可能犯错误的概率是多少? 38、 根据某摊贩的上报,每天平均营业额为55元,经过6天的抽查,营业额(单位:元): 59.2,68.3,57.8,56.5,63.7,57.3。问原摊贩的说法是否可信? 39、 某汽车轮胎厂声称,该厂一等品的轮胎的平均寿命在一定的重量和正常行驶条件下大于25000公里。对一个由 15个轮胎组成的随机样本进行实验,得到的平均值和标准差分别为 27000公里和5000公里。假定轮胎
42、寿命近似服从正态分布,试问是否可以相信产品同厂家所说的标准相符?设a0.05 40、 某研究人员为证实知识分子家庭的平均子女数低于工人家庭的平均子女数(后者平均子女数为 2.5人)。作了共 100名知识分子的抽样调查。其结果为:x(平均12子女数)2.1人,s(标准差)1.1人。问上述说法是否得以证实? 41、 完成生产线上某件工作的平均工作时间不少于 15.5分钟,标准差为 3 分钟。对随机抽选的9名职工讲授一种新的方法,训练期结束后这9名职工完成此项平均工作时间为 13.5 分钟。这个结果是否说明新的方法所需要时间比老方法所需要时间短?设a0.05,并假定完成这件工作的时间近似服从正态分布
43、。 42、 为了解某地居民住房条件而进行的类型抽样资料如下: N n 户均住房面积 标准差 (户) (户) (平方米) 城镇居民 600 60 30 9 农村居民 400 40 50 8 试以95%的置信度推断该地居民的户均住房面积。 43、一个分层随机样本的资料如下表所示,试求总体均值 u的置信度为 95的置信区间。 层 Nh nh Xh S2h 1 500 50 60 10 2 700 70 70 20 3 800 80 90 30 合计 2000 2000 44、某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤。现经过品种改良实验,从25个小区抽样,结果小麦平均亩产比原来提高
44、20公斤。对检验假设H0:u250,H1250的问题,求u270时不犯第二类错误的概率。假定小麦亩产服从正态分布。a0.05。 45、一个容量n81的随机样本给出的平均值和标准差分别为485和45。( 1 )检验原假设u500,设a0.01;(2)检验原假设u500,设a0.05。 46、大小为50的一个样本,其平均值为 10.5,标准差是 2.2,检验总体平均值为 10.0的假设:( 1 )在 0.05水平上用单尾检验;(2)在0.01水平上用双尾检验。如样本数改为25和100,请进行同样的检验并比较检验结果。 47、假设某工人平均年收入是7000元,标准差是900元。一研究者假设工会中的活
45、跃分子的平均工资收入要高于一般水平,并从活跃分子中抽出一个大小为 85的随机样本,所获平均值是7200元,标准差是1000元。问工会活跃分子的收入是否显著高于其他非活跃分子。a0.01。 48、对200个街区有选举权的居民进行民意测验,发现两个候选人中的A获得抽样中的 54选民支持。这样便可以得出 A将获胜的结论吗?利用 a0.05 水平并列出所需要的全部假设。 49、设总体服从正态分布 N(u,9),X为容量为 n 的样本均值,若已知 P(|u X|1)0.90,试求n至少应为多少? 1350、设某个计算公司所使用的现行系统,通过每个流程的平均时间为45s,今在一个新的系统中进行试验。通过9
46、个程序所需要的计算时间如下(单位:s): 30,37,42,35,36,47,40,48,45 由此数据能否断言,新的系统能减少通过程序的平均时间?假定通过每个程序的时间服从正态分布。a0.05 双样本和多样本的假设检验 1、试述小样本总体均值差检验有哪些假设? 2、某大型超级市场的经理某一天内在该市的6个结帐台分别观察顾客人数,观察结果如下所示。试问这些数据是否提供了充足的证据表明某些结帐台胜过另一些结帐台。a0.05。 结帐台号 1 2 3 4 5 6 频数 84 110 146 152 61 47 3、设某社会科学研究者试图发现医生和牙医样本的平均年收入之差是500元,并分别估计两标准差
47、是 1900元和1600元。如果在 0.05 的水平上建立起医生和牙医的平均收入的显著差异关系。研究者应需要多少样本?如果需要的医生数量是牙医的两倍,那么又需要多少样本? 4、某广告公司进行一项空调器的用户特点调查。从装有空调器的家庭中随机抽选 300户,其中年人均生活费收入超过 7000 元的有 170 户,从未装空调器的家庭中随机抽取200户,其中年人均生活费收入超过7000的46户。是对已装和未装空调的两种家庭年人均生活费收入超过7000元的成数之差构造置信度为95的置信区间。 5、为比较两位银行职员为新顾客办理个人结算账单的平均时间长度,分别给两位职员随机安排了10为顾客,并记录下每位
48、顾客办理账单所要的时间(单位:分钟),相应的样本均值和方差为x125.2,s2116.64;x222.5,s2214.92。假定每位职员办理的时间服从正态分布,且方差相等。试求两位职员办理账单的服务时间之差的95的区间估计。 6、为调查甲乙证券公司投资者的投资存款数,分别从两家证券公司抽选由25名投资者组成的随机样本,两个样本均值分别是45,000元和32,000元。根据以往的经验,知道两个总体均服从正态分布,标准差分别是920元和960元。试求u1-u2的置信度为90的置信区间。 7、某大学共有1000名毕业生,其中男生600名,女生400名,分别随机抽选100名男生和80名女生,发现通过英语6级的人数分别是45人和55人,试求该校毕业生已通过英语6级考试的成数的置信度为95的致信区间。 8、某地区由1000家企业,按大中小型分为三层,其企业数分别为200,300,500家,今按比例分配抽取容量100的分层随机样本,年产值平均为1200万元,750万元和40万元。各层样本方差分别为 s21490;s22250,s2390,试求该地区企业平均