1、1模块复习课核心知识回顾一、计数原理1分类加法计数原理完成一件事有两类不同方案,在第 1 类方案中有 m 种不同的方法,在第 2 类方案中有n 种不同的方法那么完成这件事共有 N m n 种不同的方法2分步乘法计数原理完成一件事需要两个步骤,做第 1 步有 m 种不同的方法,做第 2 步有 n 种不同的方法,那么完成这件事共有 N mn 种不同的方法3排列数(1)从 n 个不同元素中取出 m(m n)个元素的所有不同排列的个数叫做从 n 个不同元素中取出 m 个元素的排列数,用 A 表示;mn(2)排列数公式 A n(n1)( n2)( n m1) .mnn! n m !4组合数(1)从 n
2、个不同元素中取出 m(m n)个元素的所有不同组合的个数,叫做从 n 个不同元素中取出 m 个元素的组合数,用符合 C 表示mn(2)组合数公式 C mnn n 1 n 2 n m 1m! n!m! n m !组合数性质:C C .C C C .mn n mn mn 1 mn m 1n5二项式定理(1)二项式定理公式( a b)nC anC an1 bC an kbkC bn叫做二项式定理0n 1n kn n(2)相关概念公式右边的多项式叫做( a b)n的二项展开式;各项的系数 C 叫做二项式系数;kn展开式中的 C an kbk叫做二项展开式的通项,记作 Tk1 ,它表示展开式的第 k1k
3、n项6杨辉三角(1)杨辉三角的特点在同一行中,每行两端都是 1,与这两个 1 等距离的项的系数相等;在相邻的两行中,除 1 以外的每一个数都等于它“肩上”两个数的和,即 C Crn 12C .r 1n rn(2)各二项式系数的和C C C C 2 n;0n 1n 2n nC C C C C C 2 n1 .0n 2n 4n 1n 3n 5n二、随机变量及其分布1离散型随机变量所有取值可以一一列出的随机变量,称为离散型随机变量2离散型随机变量的分布列的定义及性质(1)一般地,若离散型随机变量 X 可能取的不同值为 x1, x2, xi, xn, X 取每一个值 xi(i1,2, n)的概率 P(
4、X xi) pi,以表格形式表示为:X x1 x2 xi xnP p1 p2 pi pn称上表为离散型随机变量 X 的概率分布列,简称为 X 的分布列用等式可表示为P(X xi) pi, i1,2, n,离散型随机变量分布列还可以用图象表示(2)离散型随机变量分布列的性质:() pi0, i1,2, n;() i1.ni 1p3特殊分布(1)两点分布X 0 1P 1 p p像上面这样的分布列叫做两点分布如果随机变量 X 的分布列为两点分布,就称 X 服从两点分布,并称 P p(x1)为成功概率(2)超几何分布一般地,在含有 M 件次品的 N 件产品中,任取 n 件,其中恰有 X 件次品,则 P
5、(X k) , k0,1,2, m,即CkmCn kN MCnNX 0 1 mP C0MCn 0N MCnN C1MCn 1N MCnN CmMCn mN MCnN其中 mmin M, n,且 n N, M N, n, M, NN *.如果随机变量 X 的分布列具有上表的形式,则称随机变量 X 服从超几何分布4条件概率(1)条件概率的定义3一般地,设 A, B 为两个事件,且 P(A)0,称 P(B|A) 为在事件 A 发生的条P ABP A件下,事件 B 发生的条件概率 P(B|A)读作 A 发生的条件下 B 发生的概率(2)条件概率的性质任何事件的条件概率都在 0 和 1 之间,即 0 P
6、(B|A)1.如果 B 和 C 是两个互斥事件,则 P(B C|A) P(B|A) P(C|A)5事件的相互独立性(1)相互独立事件的概念设 A, B 为两个事件,若 P(AB) P(A)P(B),则称事件 A 与事件 B 相互独立(2)相互独立事件的性质如果事件 A 与 B 相互独立,那么 A 与 , 与 B, 与 也都相互独立B A A B 6独立重复试验与二项分布(1)n 次独立重复试验一般地,在相同条件下重复做的 n 次试验称为 n 次独立重复试验(2)二项分布一般地,在 n 次独立重复试验中,用 X 表示事件 A 发生的次数,设每次试验中事件 A发生的概率为 p,则 P(X k)C
7、pk(1 p)n k, k0,1,2, n.此时称随机变量 X 服从kn二项分布,记作 X B(n, p),并称 p 为成功概率7离散型随机变量的均值与方差(1)一般地,若离散型随机变量 X 的分布列为X x1 x2 xi xnP p1 p2 pi pn则称 E(X) ipi为随机变量 X 的均值或数学期望它反映了离散型随机变量取值ni 1x的平均水平则把 D(X) (xi E(X)2pi叫做随机变量 X 的方差, D(X)的算术平方根 叫做ni 1 D X随机变量 X 的标准差,随机变量的方差和标准差都反映了随机变量取值偏离于均值的平均程度(2)两点分布与二项分布的均值若随机变量 X 服从两
8、点分布,则 E(X) p; D(X) p(1 p);若 X B(n, p),则 E(X) np, D(X) np(1 p)(3)性质4若 Y aX b,其中 a, b 为常数,则 E(Y) E(aX b) aE(X) D(aX b) a2D(X)8正态分布(1)定义一般地,如果对于任何实数 a, b(a b),随机变量 X 满足 P(a X b) , (x)badx,则称随机变量 X 服从正态分布正态分布完全由参数 和 确定,因此正态分布常记作 N( , 2)如果随机变量 X 服从正态分布,则记为 N( , 2)(2)正态分布在三个特殊区间内取值的概率及 3 原则 P( X )0.6827;P
9、( 2 X 2 )0.9545;P( 3 X 3 )0.9973.三、统计案例1回归分析(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(2)回归直线方程方程 x 是两个具有线性相关关系的变量的一组数据( x1, y1),( x2, y2),y b a ,( xn, yn)的回归方程,其中 , 是待定参数,其最小二乘估计分别为:a b 其中 ,( , )称为样本点的中心x y 2独立性检验(1)22 列联表一般地,假设有两个分类变量 X 和 Y,它们的取值分别为 x1, x2和 y1, y2,其样本频数列联表(称为 22 列联表)为y1 y2 总计x1 a b a b
10、x2 c d c d总计 a c b d a b c d5(2)K2 ,其中 n a b c d 为样本容量n ad bc 2 a b c d a c b d易错易混辨析1将 3 个不同的小球放入 4 个盒子中,则有不同的放法种数有 34个()提示 本题是一个分步计数问题对于第一个小球有 4 种不同的放法,第二个小球也有 4 种不同的放法,第三个小球也有 4 种不同的放法,跟据分步乘法计数原理知共有44464 种不同的放法2从甲、乙等 6 人中选出 3 名代表,甲一定当选,则有 20 种选法()提示 因为甲一定当选,所以只要从剩下的 5 人中选出 2 人即可,因此有 C 10 种25选法3三个
11、人踢球,互相传递,每人每次只能踢一下,由甲开始踢,经过 5 次传递后,球又回给甲,则不同的传递方式共有 10 种 ()提示 可利用树状图进行求解式子 A 中 m n. ()mnn! n m !提示 当 m n 时,( n m)!0!1,即求 n 个元素的全排列数5由 0,1,2,3 这 4 个数字组成的四位数中,有重复数字的四位数共有343 A 168(个) ()34提示 首位不含 0,有 3 种选法,其余 3 位都有 4 种选法,共有 343192 个四位数;其中没有重复数字的有 332118 个,故有重复数字的四位数共有19218174 个63 名医生和 6 名护士被分配到三所学校为学生体
12、检,每校分配 1 名医生和 2 名护士,则不同的分配方法有 540 种 ()7( a b)n的展开式中某一项的二项式系数与 a,b 无关 ()8在 的二项展开式中,常数项为160. ()(x2x)6 9在(1 x)9的展开式中系数最大的项是第 5 项和第 6 项 ()提示 由通项公式得 Tr1 C (1) rxr故第 r1 项的系数为(1) rC .r9 r9故当 r4 时,即第 5 项的系数最大10若(3 x1) 7 a7x7 a6x6 a1x a0,则 a7 a6 a1的值为 128. ()提示 当 x0 时, a01,当 x1 时 a7 a6 a5 a1 a02 7, a7 a6 a5
13、a12 71129.611若 的展开式中,仅有第 5 项的二项式系数最大,且 x4的系数为 7,则实(x a3x)n 数 a . ()1212离散型随机变量是指某一区间内的任意值 ()提示 随机变量的取值都能一一列举出来13在区间0,10内任意一个实数与它四舍五入取整后的整数的差值是离散型随机变量 ()提示 可以取区间0,10内的一切值,无法按一定次序一一列出,故其不是离散型随机变量14离散型随机变量的分布列的每个随机变量取值对应概率都相等()提示 因为分布列中的每个随机变量能代表的随机事件,并非都是等可能发生的事件15在离散型随机变量分布列中,所有概率之和为 1. ()提示 由分布列的性质可
14、知,该说法正确16超几何分布的模型是不放回抽样 ()17超几何分布的总体里可以有两类或三类特点 ()提示 超几何分布的模型特征是“由较明显的两部分组成” 18若事件 A 发生的条件下,事件 B 发生,相当于 A, B 同时发生()19小王通过英语听力测试的概率是 ,他连续测试 3 次,那么其中恰好第 3 次测试获13得通过的概率是 P C . ()13(13)1 (1 13)2 49提示 所求概率应为 P .23 23 13 42720试验之前可以判断离散型随机变量的所有值 ()提示 因为随机试验所有可能的结果是明确并且不只一个,只不过在试验之前不能确定试验结果会出现哪一个,故该说法正确21必
15、然事件与任何一个事件相互独立 ()提示 必然事件的发生与任何一个事件的发生,没有影响22二项分布中随机变量 X 的取值是小于等于 n 的所有正整数 ()提示 二项分布中随机变量 X 的取值是小于等于 n 的所有自然数23若 a 是常数,则 D(a)0. ()724已知 Y3 X2,且 D(X)10,则 D(Y)92. ()提示 D(X)10,且 Y3 X2 D(Y) D(3X2)9 D(X)90.25离散型随机变量的概率分布规律用分布密度曲线描述,连续型随机变量的概率分布用分布列描述 ()提示 因为离散型随机变量的概率分布规律用分布列描述,连续型随机变量的概率分布规律用分布密度曲线(函数)描述
16、26正态曲线是单峰的,其与 x 轴围成的面积是随参数 , 的变化而变化的 ()提示 正态曲线与 x 轴围成的面积是 1,它不随 和 变化而变化27若 K2的观测值 k6.635,则在犯错误的概率不超过 0.01 的前提下,认为吸烟与患肺病有关系,那么在 100 个吸烟的人中必有 99 人患有肺病 ()提示 K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故此说法不正确28如果两个变量 x 与 y 之间不存在着线性关系,那么根据它们的一组数据( xi, yi)(i1,2, n)不能写出一个线性方程 ()提示 任何一组( xi, yi)(i1,2, n)都能
17、写出一个线性方程,只是有无意义的问题,因此这个说法错误,线性关系是可以检验的,可以画出带状散点图,可以写出一个拟合效果最好的线性方程29利用线性回归方程求出的值是准确值 ()提示 因为利用线性回归方程求出的值为估计值,而不是真实值30变量 x 与 y 之间的回归直线方程表示 x 与 y 之间的真实关系形式()提示 因为变量 x 与 y 之间的线性回归直线方程仅表示 x 与 y 之间近似的线性关系,x 与 y 之间满足 y bx a e,其中 e 为随机误差高考真题感悟1(2017全国卷,6) (1 x)6展开式中 x2的系数为( ) (11x2)【导学号:95032268】A15 B20C30
18、 D35C 因为(1 x)6的通项为 C xr,所以 (1 x)6展开式中含 x2的项为 1C x2和r6 (11x2) 26C x4.1x2 468因为 C C 2C 2 30,26 46 266521所以 (1 x)6展开式中 x2的系数为 30.(11x2)故选 C.2(2017全国卷,6)安排 3 名志愿者完成 4 项工作,每人至少完成 1 项,每项工作由 1 人完成,则不同的安排方式共有( )A12 种 B18 种C24 种 D36 种D 由题意可得其中 1 人必须完成 2 项工作,其他 2 人各完成 1 项工作,可得安排方式为 C C A 36(种),或列式为 C C C 3 23
19、6(种)13 24 2 13 24 12432故选 D.3(2017全国卷,4)( x y)(2x y)5的展开式中 x3y3的系数为( )A80 B40C40 D80C 因为 x3y3 x(x2y3),其系数为C 2240,35x3y3 y(x3y2),其系数为 C 2380.25所以 x3y3的系数为 804040.故选 C.4(2017浙江卷,8)已知随机变量 i满足 P( i1) pi,P( i0)1 pi, i1,2.若 0D( 2)C E( 1)E( 2), D( 1)E( 2), D( 1)D( 2)A 由题意可知 i(i1,2)服从两点分布, E( 1) p1, E( 2) p
20、2, D( 1) p1(1 p1), D( 2) p2(1 p2)又06.635,故有 99%的把握认为箱产量与养殖方法有关(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于 50 kg 的直方图面积为(0.0040.0200.044)50.340.5,故新养殖法产量的中位数的估计值为50 52.35(kg)0.5 0.340.0689(2017全国卷)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4 元,售价每瓶 6 元,未售出的酸奶降价处理,以每瓶 2 元的价格当天全部处理完根据往年销售经验,每天需求量与当天最高气温(单位:)有关如果最高气温不低于 25,需求量为 500 瓶
21、;如果最高气温位于区间20,25),需求量为 300 瓶;如果最高气温低于20,需求量为 200 瓶为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温 10,15) 15,20) 20,25) 25,30) 30,35) 35,40)天数 2 16 36 25 7 4以最高气温位于各区间的频率代替最高气温位于该区间的概率(1)求六月份这种酸奶一天的需求量 X(单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润为 Y(单位:元),当六月份这种酸奶一天的进货量 n(单位:瓶)为多少时, Y 的数学期望达到最大值?解 (1)由题意知, X 所有可能取值
22、为 200,300,500,由表格数据知 P(X200)0.2, P(X300) 0.4,2 1690 3690P(X500) 0.4.25 7 49013因此 X 的分布列为X 200 300 500P 0.2 0.4 0.4(2)由题意知,这种酸奶一天的需求量至多为 500,至少为 200,因此只需考虑200 n500.当 300 n500 时,若最高气温不低于 25,则 Y6 n4 n2 n;若最高气温位于区间20,25),则 Y63002( n300)4 n1 2002 n;若最高气温低于 20,则 Y62002( n200)4 n8002 n.因此 EY2 n0.4(1 2002 n
23、)0.4(8002 n)0.26400.4 n.当 200 n300 时,若最高气温不低于 20,则 Y6 n4 n2 n;若最高气温低于 20,则 Y62002( n200)4 n8002 n,因此 EY2 n(0.40.4)(8002 n)0.21601.2 n.所以 n300 时, Y 的数学期望达到最大值,最大值为 520 元10(2016全国卷,19)某公司计划购买 2 台机器,该种机器使用三年后即被淘汰机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个 200元在机器使用期间,如果备件不足再购买,则每个 500 元现需决策在购买机器时应同时购买几个易损零件,为此搜集
24、并整理了 100 台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这 100 台机器更换的易损零件数的频率代替 1 台机器更换的易损零件数发生的概率,记 X 表示 2 台机器三年内共需更换的易损零件数, n 表示购买 2 台机器的同时购买的易损零件数(1)求 X 的分布列;(2)若要求 P(X n)0.5,确定 n 的最小值;(3)以购买易损零件所需费用的期望值为决策依据,在 n19 与 n20 之中选其一,应选用哪个?【导学号:95032271】14解 (1)由柱状图及以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11 的概率分别为 0.2,0.4,0.2,
25、0.2.从而 P(X16)0.20.20.04;P(X17)20.20.40.16;P(X18)20.20.20.40.40.24;P(X19)20.20.220.40.20.24;P(X20)20.20.40.20.20.2;P(X21)20.20.20.08;P(X22)0.20.20.04.所以 X 的分布列为X 16 17 18 19 20 21 22P 0.04 0.16 0.24 0.24 0.2 0.08 0.04(2)由(1)知 P(X18)0.44, P(X19)0.68,故 n 的最小值为 19.(3)记 Y 表示 2 台机器在购买易损零件上所需的费用(单位:元)当 n19
26、 时,E(Y)192000.68(19200500)0.2(192002500)0.08(192003500)0.044 040;当 n20 时,E(Y)202000.88(20200500)0.08(202002500)0.044 080.可知当 n19 时所需费用的期望值小于当 n20 时所需费用的期望值,故应选 n19.11(2016全国卷,18)某险种的基本保费为 a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:上年度出险次数 0 1 2 3 4 5保 费 0.85a a 1.25a 1.5a 1.75a 2a设该险种一续保人一年内出险
27、次数与相应概率如下:一年内出险次数 0 1 2 3 4 5概 率 0.30 0.15 0.20 0.20 0.10 0.05(1)求一续保人本年度的保费高于基本保费的概率;(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出 60%的概率;(3)求续保人本年度的平均保费与基本保费的比值解 (1)设 A 表示事件“一续保人本年度的保费高于基本保费” ,则事件 A 发生当且仅当一年内出险次数大于 1,故P(A)0.20.20.10.050.55.15(2)设 B 表示事件“一续保人本年度的保费比基本保费高出 60%”,则事件 B 发生当且仅当一年内出险次数大于 3,故 P(B)0.10.050.15.又 P(AB) P(B),故 P(B|A) .P ABP A P BP A 0.150.55 311因此所求概率为 .311(3)记续保人本年度的保费为 X,则 X 的分布列为X 0.85a a 1.25a 1.5a 1.75a 2aP 0.30 0.15 0.20 0.20 0.10 0.05EX0.85 a0.30 a0.151.25 a0.201.5 a0.201.75 a0.102 a0.051.23a.因此续保人本年度的平均保费与基本保费的比值为 1.23.