1、第六讲 统计一、知识与方法1、 三种抽样方法:简单随机抽样、系统抽样、分层抽样例 1、写出下列各抽样的方法。 (1) 、从 10 人中抽 2 人去参加某项活动, ;(2) 、从 200 人中抽 20 人去参加某项活动, ;(3) 、从 40 个老年人、100 个青年人、60 个中年人中抽取 20 人去参加某项活动, 例 2、以下各号码是用系统抽样方法抽取的是( )A、3, 13,18,34 B、13,23,33,43 C、5,15,20 ,30 D、10 ,5,8,7例 3、从 40 个老年人、100 个青年人、60 个中年人中抽取 20 人去参加某项活动,则青年人就抽取 人。例 4、从容量为
2、 N 的总体中抽取 20 人,若每个个体被抽到的可能性为 ,则 N= 1.02、 用样本估计总体:(1)频率分布表、频率分布直方图、茎叶图(2)极差、中位数、众数、平均数、标准差/方差例 1、右图所示的频率分布表(1) 、 , , nab(2) 、估计在(10,20)内的概率为 例 2、甲乙两人的 5 次射击成绩(单位:环)如下表:甲 6 7 8 9 10乙 5 7 8 10 10(1) 、乙的极差为 ,众数为 ,平均数为 ,方差为 (2) 、从甲、乙的成绩分析可知,应该派 去参加比赛。例 3、有一个容量为 200 的样本,其频率分布直方图如图所示。(1) 该样本的众数为 (2) 第三组的频率
3、为 ,频数为 ,(3) 第五组的高为 例 4、某小组的一次考试成绩的的茎叶图如图: 分组 频数 频率0,10 4 2.0( 10,15)6( 15,20)ab( 20,25)3合计 n11,22,3,3,41,5,646789(1)、众数为 ,中位数为 (2) 、极差为 ,平均数为 3、 变量的相关性:散点图、线性回归方程例、已知关于 的统计数据如右表,yx,(1)根据该表可知 呈 相关;(2)若由该表可得线性回归方程为 ,则 ;且 时, 4.9axy6xy4、回归分析与独立性检验例 1、 在一次有关物理学与数学成绩是否相关的研究中,发现 的观测值约为 ,根据2K8.7附表,可推测(1)认为“
4、物理学与数学成绩有关系”犯错误的概率为 (2)有 %的把握认为“物理学与数学成绩有关系” 。例 2、在一次飞机航程中调查男女乘客的晕机情况,其二维条形图如图:(1) 完成 列联表:( )dcban晕机 不晕机 合计男 a女 cd合计 n(2) 计算 的观测值 ,)()(22 dbcadbaKk并由此判断“晕机与性别有关”的把握性为 % 。x2 3 4 5y26 39 49 54)(2kKP0050 0025 0010 00013841 5024 6635 10828晕机不晕机307080女 男20二、巩固练习:1.为了普及环保知识,增强环保意识,某大学随即抽取 30 名学生参加环保知识测试,得
5、分(十分制)如图所示,假设得分值的中位数为 ,众数为 ,平均值为 ,则( )emoxA. eomxB. C. eoxD.m2、为了解儿子身高与其父亲身高的关系,随机抽取 5 对父子的身高数据如下:父亲身高x(cm)174 176 176 176 178儿子身高y(cm)175 175 176 177 177则 y 对 x 的线性回归方程为( )A. y = x-1 B. y = x+1 C. y = 88+ D. y = 176+2x12x3.某校选修乒乓球课程的学生中,高一年级有 30 名,高二年级有 40 名。现用分层抽样的方法在这 70 名学生中抽取一个样本,已知在高一年级的学生中抽取了
6、 6 名,则在高二年级的学生中应抽取的人数为( )A. 6 B. 8 C. 10 D.124、有一个容量为 66 的样本,数据的分组及各组的频数如下:1.5,2 15.,9 4 19.5,23 9 23.5,7 187311 3 12 7 4 3根据样本的频率分布估计,大于或等于 31.5 的数据约占( )(A) 21 (B) 13 (C) 12 (D) 235、设 , 是变量 和 的 次方个样本点,直线 是由这些2(,),xy(,)nxyxynl样本点通过最小二乘法得到的线性回归直线(如图) ,以下结论正确的是( )(A) 和 的相关系数在 0 到 1 之间 (B) 和 的相关系数为直线 的
7、斜率xy xyl(C)直线 过点 (D)当 为偶数时,分布在 两侧的样本点的个数一定相同l(,)nl6、通过随机询问 110 名不同的大学生是否爱好某项运动,得到如下的列联表:由表计算可得 的观测值约为 ,2K8.7由此可得到的正确结论是( )A 有 99%以上的把握认为“爱好该项运动与性别有关”B 有 99%以上的把握认为“爱好该项运动与性别无关”C 在犯错误的概率不超过 01% 的前提下,认为“爱好该项运动与性别有关”D 在犯错误的概率不超过 01% 的前提下,认为“爱好该项运动与性别无关”7、有一个容量为 200 的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落
8、在区间10,12内的频数为A.18 B.36 C.54 D.728、从一堆苹果中任取 10 只,称得它们的质量如下(单位:克)125,120,122 ,105 ,130 ,114,116,95,120 ,134。则样本数据落在内的频率为( ))5.124,A、0.2 B、 0.3 C、0.4 D、0.59、某高校甲、乙、丙、丁四个专业分别有 150、150、400、300 名学生,为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取 40 名学生进行调查,应在丙专业抽取的学生人数为 .10、为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月 1号到 5 号每天打篮球的时间 x(单位:小时)与当天投篮命中率 y 之间的关系:时间 x 1 2 3 4 5命中率 y 04 05 06 06 04小李这 5 天的平均投篮命中率为 ,用线性回归分析的方法,预测小李该月 6 号打 6 小时篮球的投篮命中率为 男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 11011、某市有大型超市 200 家、中型超市 400 家,小型超市 1400 家,为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为 100 的样本,应抽取中型超市 家12、某老师从星期一到星期五收到信件数分别是 10,6,8,5,6,则该组数据的方差 _2s