1、统计概念,1简单随机抽样 (1)设一个总体含有N个个体,从中逐个_地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的_,就把这种抽样方法叫做简单随机抽样 (2)最常用的简单随机抽样的方法有两种:_和_,不放回,机会都相等,抽签法,随机数表法,随机抽样,2系统抽样的步骤 假设要从容量为N的总体中抽取容量为n的样本 (1)先将总体的N个个体_,编号,分段间隔k,分段,(3)在第1段用_确定第一个个体编号l(lk),简单随机抽样,(4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号_,再加k得到第3个个体编号_,依次进行下去,直到获取整个样本 3分层抽样 (1)定
2、义:在抽样时,将总体_的层,然后按照_,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样 (2)应用范围:当总体是由_的几个部分组成时,往往选用分层抽样,(lk),(l2k),分成互不交叉,一定的比例,差异明显,1三种抽样方法有什么共同点和联系? 【提示】 共同点:抽样过程中每个个体被抽取的机会均等 联系:系统抽样中在分段后确定第一个个体时采用简单随机抽样,分层抽样中各层抽样时采用简单随机抽样或系统抽样,2系统抽样中,一般情况下被抽到的个体的编号有什么特征? 【提示】 被抽到个体的编号能组成等差数列,其中公差为分段间隔,1(人教A版教材习题改编)老师在班
3、级50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的学生进行作业检查,这种抽样方法是( ) A随机抽样 B分层抽样 C系统抽样 D以上都不是 【解析】 因为抽取学号是以5为公差的等差数列,故采用的抽样方法应是系统抽样 【答案】 C,2要完成下列两项调查: 从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标; 从某中学的15名艺术特长生中选出3人调查学习负担情况宜采用的抽样方法依次为( ) A简单随机抽样法,系统抽样法 B分层抽样法,简单随机抽样法 C系统抽样法,分层抽样法 D都用分层抽样法,【解析】 中由
4、于收入差别较大,宜于用分层抽样, 中个数较少,宜于用简单随机抽样 【答案】 B,3(2012浙江高考)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为_,【答案】 160,4(2012江苏高考)某学校高一、高二、高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_名学生 【解析】 设应从高二年级抽取x名学生,则x50310.解得x15. 【答案】 15,1作频率分布直方图的步骤 (1)求极差(即一组数据中_与_的差) (2)决定组距与组数 (3)将数据_ (
5、4)列_ (5)画频率分布直方图,最大值,最小值,分组,频率分布表,样本估计总体,2频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的_,就得到频率分布折线图 (2)总体密度曲线:随着_的增加,作图时_增加,_减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线 3茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数,中点,样本容量,所分的组数,组距,4标准差和方差 (1)标准差是样本数据到平均数的一种_ (2)标准差:s _(3)方差:s2_ (xn是样本数据,n是样本容量,
6、是样本平均数),平均距离,1在一组数据中,中位数,平均数分别指什么?,2如何利用频率分布直方图估计样本的中位数与众数? 【提示】 (1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值 (2)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标,1(人教A版教材习题改编)若某校高 一年级8个班参加合唱比赛的得分如 茎叶图931所示,则这组数据的 中位数和平均数分别是( ) A91.5和91.5 B91.5和92 C91和91.5 D92和92,【答案】 A,2(2012山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,
7、88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( ) A众数 B平均数 C中位数 D标准差 【解析】 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变 【答案】 D,3(2013潮州质检)某部门计划对某路段进行限速,为调查限速60 km/h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按40,50),50,60),60,70),70,80分组,绘制成如图932所示的频率分布直方图,则这300辆汽车中车速低于限速的汽车有( ) A75辆 B120辆 C180辆 D270
8、辆,【解析】 因为a1(0.010.030.035)100.25,所以数据在40,50),50,60)的频率分别为0.25,0.35,则这300辆汽车中车速低于限速的汽车有0.6300180(辆),故选C. 【答案】 C,【答案】 6.8,1两个变量的线性相关 (1)在散点图中,点散布在从_到_的区域,对于两个变量的这种相关关系,我们将它称为正相关 (2)在散点图中,点散布在从_到_的区域,两个变量的这种相关关系称为负相关 (3)如果散点图中点的分布从整体上看大致在_,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,左下角,右上角,左上角,右下角,一条直线附近,相关关系,2回归方程
9、(1)最小二乘法:使得样本数据的点到回归直线的_和最小的方法叫最小二乘法,距离的平方,4独立性检验 (1)利用随机变量_来判断“两个分类变量_”的方法称为独立性检验,K2,有关系,(2)列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为,构造一个随机变量K2_, 其中n_为样本容量,abcd,K值表:,1(人教A版教材习题改编)下面是22列联表:则表中a,b的值分别为( ) A94,72 B52,50 C52,74 D74,52,【解析】 a2173,a52. 又a22b,b74. 【答案】
10、C,3(2013汕头质检)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元 【解析】 由题意知0.254(x1)0.321(0.254x0.321)0.254. 【答案】 0.254,4在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是_的(填有关或无关) 【解析】 k27.636.635, 有99%的把握认为“打鼾与患心脏病有关” 【答案】 有关,