1、7.概率与统计要点重温1随机抽样方法简单随机抽样、系统抽样、分层抽样的共同点是抽样过程中每个个体被抽取的机会相等,且是不放回抽样应用 1 某社区现有 480 个住户,其中中等收入家庭 200 户、低收入家庭 160 户,其他为高收入家庭在建设幸福社区的某次分层抽样调查中,高收入家庭被抽取了 6 户,则该社区本次抽取的总户数为_解析 设本次抽取的总户数为 x,由抽样比例可知 ,则 x24.6x 480 200 160480答案 242对于统计图表问题,求解时,最重要的就是认真观察图表,从中提取有用信息和数据对于频率分布直方图,应注意的是图中的每一个小矩形的面积是数据落在该区间上的频率茎叶图没有原
2、始数据信息的损失,但数据很大或有多组数据时,茎叶图就不那么直观、清晰了应用 2 在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图 23 所示:图 23若将运动员按成绩由好到差编为 135 号,再用系统抽样方法从中抽取 7 人,则其中成绩在区间139,151上的运动员人数是_解析 由题意知,将 135 号分成 7 组,每组 5 名运动员,落在区间139,151的运动员共有 4 组,故由系统抽样法知,共抽取 4 名答案 43样本数据的数字特征在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底
3、边中点的横坐标之和,众数是最高矩形的中点的横坐标标准差的平方就是方差,方差的计算(1)基本公式 s2 (x1 )2( x2 )2( xn )21n x x x(2)简化计算公式 s2 (x x x ) n 2,或写成 s2 (x x x )1n 21 2 2n x 1n 21 2 2n 2,即方差等于原数据平方和的平均数减去平均数的平方x应用 3 (1)某工厂对一批新产品的长度(单位:mm)进行检测,如图 24 是检测结果的频率分布直方图,据此估计这批产品的中位数为( )图 24A20 B25C22.5 D22.75(2)已知样本数据 3,4,5, x, y 的平均数是 5,标准差是 ,则 x
4、y( )2A42 B40C36 D30(3)某公司为了解用户对其产品的满意度,随机调查了 40 个用户,根据用户满意度的评分制成频率分布直方图(如图 25),则该地区满意度评分的平均值为_. 【导学号:07804193】图 25解析 (1)产品的中位数出现在概率是 0.5 的地方自左至右各小矩形面积依次为0.1,0.2,0.4,设中位数是 x,则由 0.10.20.08( x20)0.5,得 x22.5,故选 C.(2)由 5 得 x y13, 3 4 5 x y5由 15 3 5 2 4 5 2 5 5 2 x 5 2 y 5 2 2得 x2 y210 x10 y450, 10得, x2 y
5、285 2得,2 xy84,即 xy42,故选 A.(3)由直方图估计评分的平均值为550.05650.2750.35850.25950.1577.5.答案 (1)C (2)A (3)77.54变量间的相关关系变量间的相关关系以散点图为基础,设( x1, y1),( x2, y2),( xn, yn)是两个具有线性相关关系的变量的一组数据,其回归方程为 x ,则y b aError!.应用 4 假设某商品的销售量 x(件)与利润 y(万元)有如下统计数据:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7.0且已知 90, 140.8, iyi112.3, 8.9, 1.4.5i 1
6、x2i5i 1y2i5i 1x 79 2(1)对 x, y 进行线性相关性检验;(2)如果 x 与 y 具有线性相关关系,求出回归直线方程,并估计销售量为 10 件时,利润约是多少?附相关公式: r , ni 1 xi x yi yni 1 xi x 2ni 1 yi y 2 bni 1 xi x yi yni 1 xi x 2, .ni 1xi yi nxyni 1x2i n x 2 a y b x解 (1) 4, 5,x2 3 4 5 65 y 2.2 3.8 5.5 6.5 7.05相关系数 r 的分子为 iyi5 122.354512.3,5i 1(xi x)(yi y)5i 1x x
7、 y5i 12 x 5 2 90516 10,(xi x)5i 12i (x)(yi )2 y 5( )2140.812515.8,5i 1 y5i 12i y所以 r 0.987.12.31015.8 12.3158 12.3792因为 0.9870.75,所以 x 与 y 之间具有很强的线性相关关系(2)因为 1.23,b i 1xiyi nxy i 1x2i n x 2 12.310 0.08,a y b x所以所求的回归直线方程为 1.23 x0.08.y当 x10 时, 1.23100.0812.38,即估计销售量为 10 件时,利润约为 12.38 y万元5独立性检验两个分类变量
8、X 和 Y 相关的可信度,常通过随机变量 K2的观测值 k来衡量, k 的值越大,说明“ X 与 Y 有关系”成立n ad bc 2 a b a c b d c d的可能性越大应用 5 甲乙两个学校高三年级分别为 1100 人,1000 人,为了统计两个学校在地区第二次模拟考试中数学科目的成绩,采用分层抽样的方法抽取了 105 名学生的成绩,并作出了部分频率分布表如下(规定考试成绩在120,150内为优秀):甲校:分组 70,80) 80,90) 90,100) 100,110) 110,120) 120,130) 130,140) 140,150频数 2 3 10 15 15 x 3 1乙校
9、:分组70,80)80,90)90,100)100,110)110,120)120,130)130,140)140,150频数 1 2 9 8 10 10 y 3(1)计算 x, y 的值,并分别估计两校数学成绩的优秀率;(2)由以上统计数据填写下面的 22 列联表,并判断是否有 97.5%的把握认为这两个学校的数学成绩有差异.甲校乙校总计优秀非优秀总计K2 .n ad bc 2 a b c d a c b d附:P(K2 k0)0.10 0.025 0.010k0 2.706 5.024 6.635解 (1)依题意知,甲校抽取 55 人,乙校抽取 50 人,故 x6, y7.估计甲校的优秀率
10、为 18.2%;乙校的优秀率为 40%.1055 2050(2)填表如下:甲校 乙校 总计优秀 10 20 30非优秀 45 30 75总计 55 50 105K2 6.109.105 1030 2045 2307555506.1095.024,有 97.5%的把握认为这两个学校的数学成绩有差异6解排列组合问题的常用策略相邻问题捆绑法;相间隔问题插空法;定位问题优先法;多元问题分类法;至多至少问题间接法;相同元素分组可采用隔板法,数量不大时可以逐一排出结果应用 6 (1)4 个不同的小球放入编号为 1、2、3、4 的 4 个盒中,则恰有 1 个空盒的放法共有_种(2)从 1、3、5、7 中任取
11、 2 个数字,从 0、2、4、6、8 中任取 2 个数字,组成没有重复数字的四位数,其中能被 5 整除的四位数共有_个(用数字作答)解析 (1)把 4 个球分成 3 组,每组至少 1 个,即分的小球个数分别为 2,1,1 的 3 组,有 种最后将三组球放入 4 个盒中的 3 个,有分配方法数 A 种,因此,放法共有C24C12C1A2 34A 144(种)C24C12C1A2 34(2)将问题分成三类:含数字 5,不含数字 0,则选元素的过程有 C C 种方法,将 513 24排在末位,则组数的过程有 A 种方法,依据分步计数原理得这一类共有 C C A 108 个;3 13243含数字 0,
12、不含数字 5,则选元素的过程有 C C 种方法,将 0 排在末位,则组数过程2314有 A 种方法,这一类共有 C C A 72 个;含数字 0,也含数字 5,则选元素的过程有3 23143C C ,若 0 在末位,则组数过程有 A 种方法,若 0 不在末位,则组数过程有 C A 种方1314 3 122法,这一类共有 C C (A C A )120 个根据分类计数原理,其中能被 5 整除的四位1314 3 122数共有 10872120300 个答案 (1)144 (2)3007二项式系数的性质(1)对称性:C C (k0,1,2, n)kn n kn(2)系数和:C C C 2 n,C C
13、 C C C C 2 n1 .0n 1n n 1n 3n 5n 0n 2n 4n(3)最值: n 为偶数时, n1 为奇数,中间一项的二项式系数最大且为第 项,二项(n2 1)式系数为 C ; n 为奇数时,( n1)为偶数,中间两项的二项式系数最大为第 项及第n2n n 121 项,其二项式系数为 .n 12应用 7 (1)设二项式 (nN *)展开式的二项式系数和与各项系数和分别为(x12)an, bn,则 ( )a1 a2 anb1 b2 bnA2 n1 3 B2(2 n1 1)C2 n1 D1(2) 展开式中的常数项为_(x 21x)解析 (1)二项式 (nN *)展开式的二项式系数和
14、为 2n,各项系数和为(x12) (1 12) ,则 an2 n, bn , 2 n1 ,故选 C.12n 12n a1 a2 anb1 b2 bn 2 2n 11 12n(2) ,由二项式定理知( x1) 8通项为 Tr1 C x8 r(1) r,令(x 21x) x 1 8x4 r8r4 得 T5C x4(1) 470 x4,故 展开式中的常数项为 70.48 (x 21x)答案 (1)C (2)708概率的计算公式(1)互斥事件有一个发生的概率 P(A B) P(A) P(B),若事件 A 与 B 对立 P(B)1 P(A)(2)古典概型的概率计算公式: P(A) ;mn card Ac
15、ard I应用 8 某班班会,准备从包括甲、乙两人的七名同学中选派 4 名学生发言,要求甲、乙两人中至少有 1 人参加,则甲、乙都被选中且发言时不相邻的概率为_解析 由题意可分两种情况只有甲乙中一人参加,有 C C A 480.12354甲乙两人参加有 C A 240 则满足条件总的发言总数为 480240720.254甲乙两人参加,且发言时不相邻的包括情况有 C A A 120.25223则甲、乙都被选中且发言时不相邻的概率为 .120720 16答案 16(3)几何概型的概率计算公式: P(A) .构 成 事 件 A的 区 域 长 度 面 积 和 体 积 试 验 的 全 部 结 果 所 构
16、 成 的 区 域 长 度 面 积 和 体 积 应用 9 在棱长为 2 的正方体 ABCDA1B1C1D1中,点 O 为底面 ABCD 的中心,在正方体ABCDA1B1C1D1内随机取一点 P,则点 P 到点 O 的距离大于 1 的概率为( ) 【导学号:07804194】A B112 12C D1 6 6解析 记“点 P 到点 O 的距离大于 1”为 A,P(A) 1 .23 1243 1323 12答案 B(4)条件概率的概率计算公式: P(B|A) .P A BP A n A Bn A应用 10 盒中装有 10 只乒乓球,其中 6 只新球,4 只旧球,不放回地依次摸出 2 个球使用,在第一
17、次摸出新球的条件下,第二次也取到新球的概率为( )A. B35 59C. D110 25解析 第一次摸出新球记为事件 A,则 P(A) ,35第二次取到新球记为事件 B,则 P(AB) ,C26C210 13 P(B|A) .P ABP A1335 59答案 B(5)相互独立事件同时发生的概率计算公式是: P(AB) P(A)P(B);(6)独立事件重复试验的概率计算公式是: Pn(k)C Pk(1 P)n k;kn(7)若 X N( , 2),则满足正态分布的三个基本概率的值是: P( X )0.682 6; P( 2 X 2 )0.954 4; P( 3 X 3 )0.997 4.应用 1
18、1 某个部件由三个元件按下图方式连接而成,元件 1 或元件 2 正常工作,且元件 3 正常工作,则部件正常工作,设三个电子元件的使用寿命(单位:小时)均服从正态分布 N(1000,502),且各个元件能否正常相互独立,那么该部件的使用寿命超过 1000 小时的概率为_图 26解析 三个电子元件的使用寿命均服从正态分布 N(1000,502),得三个电子元件的使用寿命超过 1000 小时的概率为 P ,超过 1000 小时时元件 1 或元件 2 正常工作的概率12P11(1 P)2 .34那么该部件的使用寿命超过 1000 小时的概率为 P2 P1P .38答案 389离散型随机变量的均值、方差
19、(1)离散型随机变量的均值、方差:均值: E(X) x1p1 x2p2 xipi xnpn;方差: D(X) x1 E(X)2p1 x2 E(X)2p2 xn E(X)2pn.(2)两点分布与二项分布的均值、方差若 X 服从两点分布,则 E(X) p, D(X) p(1 p)若 X B(n, p),则 E(X) np, D(X) np(1 p)应用 12 由于我市去年冬天多次出现重度污染天气,市政府决定从今年 3 月份开始进行汽车尾气的整治,为降低汽车尾气的排放量,我市某厂生产了甲、乙两种不同型号的节排器,分别从两种节排器中随机抽取 100 件进行性能质量评估检测,综合得分情况的频率分布直方图
20、如图 27 所示图 27节排器等级如表格所示综合得分 K 的范围 节排器等级k85 一级品75 k85 二级品70 k75 三级品若把频率分布直方图中的频率视为概率,则(1)如果从甲型号中按节排器等级用分层抽样的方法抽取 10 件,然后从这 10 件中随机抽取 3 件,求至少有 2 件一级品的概率;(2)如果从乙型号的节排器中随机抽取 3 件,求其二级品数 X 的分布列及数学期望解 (1)由已知及频率分布直方图中的信息知,甲型号的节排器中一级品的概率为 ,35二级品的概率为 ,则用分层抽样的方法抽取 10 件,其中有 6 件一级品,4 件二级品,所25以从这 10 件节排器中随机抽取 3 件,
21、至少有 2 件一级品的概率P1 .C34 C24C16C310 23(2)由已知及频率分布直方图中的信息知,乙型号的节排器中一级品的概率为 ,二级品710的概率为 ,三级品的概率为 .14 120如果从乙型号的节排器中随机抽取 3 件,则二级品数 X 可能的值为 0,1,2,3 .又 P(X0)C ,03 (34) 2764P(X1)C ,13 (14) (34) 2764P(X2)C ,23 (14) 34 964P(X3)C .3 (14) 164所以 X 的分布列为X 0 1 2 3P 2764 2764 964 164E(X)0 1 2 3 . 2764 2764 964 164 34
22、查缺补漏1高三学生体检,某班级随机抽取 5 名女学生的身高 x(厘米)和体重 y(公斤)的数据如下表:x 165 160 175 155 170y 58 52 62 43 60根据上表可得回归直线方程为 0.92 x ,则 ( ) y a a【导学号:07804195】A96.8 B96.8C104.4 D104.4A 回归直线方程过点( , ),而 165, 55,所以 a550.9216596.8,选x y x yA.2( x2 x2) 6的展开式中 x2的系数等于( )A48 B48C234 D432B ( x2 x2) 6(2 x)6(1 x)6(C 26C 25xC 24x2)(C
23、C xC x2)所06 16 26 06 16 26以展开式中 x2的系数为 C 26C C 25C C 24C 48.选 B.06 26 16 16 26 063如图 28 是某居民小区年龄在 20 岁到 45 岁的居民上网情况的频率分布直方图,现已知年龄在30,35),35,40),40,45的上网人数呈现递减的等差数列, 则年龄在35,40)的频率是( )图 28A0.04 B0.06 C0.2 D0.3C 30,35),35,40),40,45的概率和为 1(0.010.07)50.6,又30,35),35,40),40,45的概率依次成等差数列,所以35,40)的频率为 0.2.选
24、C.0.634某电视台的一个综艺栏目对六个不同的节目排演出顺序,最前只能排甲或乙,最后不能排甲,则不同的排法共有( )A192 种 B216 种C240 种 D288 种B 完成这件事件,可分两类:第一类,最前排甲,其余位置有 A 120 种不同的排法;5第二类,最前排乙,最后有 4 种排法,其余位置有 A 24 种不同的排法;所以共有4A 4A 216 种不同的排法5 45设不等式组Error!表示的平面区域为 D,在区域 D 内随机取一个点,则此点到坐标原点的距离大于 2 的概率是( )A. B 4 22C. D 6 4 4D 如图所示,正方形 OABC 及其内部为区域 D,且区域 D 的
25、面积为 4,而区域 D 中阴影部分内的点到坐标原点的距离大于 2,易知该阴影部分的面积为 4.因此满足条件的概率是 ,故选 D.4 46若(12 x)(12 x)7 a0 a1x a2x2 a8x8,则 a0 a1 a2 a7的值为( )A2 B3C253 D126C 令 x1,得 a0 a1 a2 a83, a82(2) 7256, a0 a7 a83253.选 C.7已知某路段最高限速 60 km/h,电子监控测得连续 6 辆汽车的速度用茎叶图表示如图 29(单位:km/h)若从中任取 2 辆,则恰好有 1 辆汽车超速的概率为( )图 29A. B415 25C. D815 35C 由茎叶
26、图可知,这 6 辆汽车中有 2 辆汽车超速,所以从中任取 2 辆,则恰好有 1 辆汽车超速的概率为 P ,故选 C.C12C14C26 8158如图 30,图案共分 9 个区域,有 6 种不同颜色的涂料可供涂色,每个区域只能涂一种颜色的涂料,其中 2 和 9 同色、3 和 6 同色、4 和 7 同色、5 和 8 同色,且相邻区域的颜色不相同,则涂色方法有( ) 【导学号:07804196】图 30A360 种 B720 种 C780 种 D840 种B 由图可知,区域 2,3,5,4 不能同色,所以 2 和 9 同色、3 和 6 同色、4 和 7 同色、5和 8 同色,且各区域的颜色均不相同,
27、所以涂色方法有 A 2720 种,故选 B.469已知某人投篮的命中率为 ,则此人投篮 4 次,至少命中 3 次的概率是_34该人投篮 4 次,命中 3 次的概率为 P1C ;该人投篮 4 次,命中189256 34(34) (1 34) 27644 次的概率为 P2C ,故至少命中 3 次的概率是 P .4(34) 81256 2764 81256 18925610已知某单位有 40 名职工,现要从中抽取 5 名职工,将全体职工随机按 140 编号,并按编号顺序平均分成 5 组按系统抽样方法在各组内抽取一个号码图 31(1)若第 1 组抽出的号码为 2,则所有被抽出职工的号码为_;(2)分别
28、统计这 5 名职工的体重(单位:kg),获得体重数据的茎叶图如图 31 所示,则该样本的方差为_(1)2,10,18,26,34 (2)62 (1)分段间隔为 8,则所有被抽出职工的号码为4052,10,18,26,34.(2) (5962707381)69.x15s2 (5969) 2(6269) 2(7069) 2(7369) 2(8169) 262.1511某工厂为了对新研发的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组检测数据( xi, yi)(i1,2,6)如下表所示:试销价格 x(元) 4 5 6 7 a 9产品销量 y(件) b 84 83 80 75 68已知变
29、量 x, y 具有线性负相关关系,且 i39, i480,现有甲、乙、丙三位6i 1x6i 1y同学通过计算求得其回归直线方程分别为:甲: 4 x54;乙: 4 x106;丙:y y4.2 x105,其中有且仅有一位同学的计算结果是正确的y(1)试判断谁的计算结果正确?并求出 a, b 的值;(2)若由线性回归方程得到的估计数据与检测数据的误差不超过 1,则该检测数据是“理想数据” 现从检测数据中随机抽取 2 个,求这两个检测数据均为“理想数据”的概率解 (1)变量 x, y 具有线性负相关关系,甲是错误的又 xi39, yi480, 6.5, 80,满足方程i 1 i 1 x y4 x106
30、,故乙是正确的y由 xi39, yi480,得 a8, b90.i 1 i 1(2)由计算可得“理想数据”有 3 个,即(4,90),(6,83),(8,75)从检测数据中随机抽取 2 个,共有 15 种不同的情形,其中这两个检测数据均为“理想数据”有 3 种情形故所求概率为 P .315 1512某技术公司新开发了 A, B 两种新产品,其质量按测试指标划分为:指标大于或等于 82 为正品,小于 82 为次品,现随机抽取这两种产品各 100 件进行检测,检测结果统计如下:测试指标 70,76) 76,82) 82,88) 88,94) 94,100元件 A 8 12 40 32 8元件 B
31、7 18 40 29 6(1)试分别估计产品 A,产品 B 为正品的概率;(2)生产一件产品 A,若是正品可盈利 80 元,次品则亏损 10 元;生产一件产品 B,若是正品可盈利 100 元,次品则亏损 20 元,在(1)的前提下,记 X 为生产 1 件产品 A 和 1 件产品 B 所得的总利润,求随机变量 X 的分布列和数学期望解 (1)产品 A 为正品的概率为 . 产品 B 为正品的概率约为 .40 32 8100 45 40 29 6100 34(2)随机变量 X 的所有取值为 180,90,60,30,P(X180) ;45 34 35P(X90) ;15 34 320P(X60) ;45 14 15P(X30) .15 14 120所以,随机变量 X 的分布列为:X 180 90 60 30P 35 320 15 120E(X)180 90 60 (30) 132.35 320 15 120