1、1概率统计知识点汇总1分类加法计数原理完成一件事有 n 类不同的方案,在第一类方案中有 m1 种不同的方法,在第二类方案中有 m2种不同的方法,在第 n 类方案中有 mn 种不同的方法,则完成这件事情,共有Nm 1m 2m n 种不同的方法2分步乘法计数原理完成一件事情需要分成 n 个不同的步骤,完成第一步有 m1 种不同的方法,完成第二步有 m2种不同的方法,完成第 n 步有 mn 种不同的方法,那么完成这件事情共有Nm 1m2mn 种不同的方法3两个原理的区别分类加法计数原理与分步乘法计数原理,都涉及完成一件事情的不同方法的种数它们的区别在于:分类加法计数原理与分类有关,各种方法相互独立,
2、用其中的任一种方法都可以完成这件事;分步乘法计数原理与分步有关,各个步骤相互依存,只有各个步骤都完成了,这件事才算完成4排列与排列数公式(1)排列与排列数从 n个 不 同 元素 中 取 出mm n个 元 素 按 照 一 定 的 顺 序 排 成 一 列 排列 所 有 不 同 排 列 的 个 数排列数(2)排列数公式A n(n 1)(n2) (nm 1) .mnn!n m!(3)排列数的性质A n!; 0!1.n5组合与组合数公式(1)组合与组合数从 n个 不 同 元素 中 取 出mm n个 元 素 合 成 一 组 组合 所 有 不 同 组 合 的 个 数 组 合 数(2)组合数公式C .mnAm
3、nAm nn 1n 2n m 1m! n!m! n m!(3)组合数的性质C 1; C ; C C C .0n mn Cn mn mn m 1n mn 126排列与组合问题的识别方法识别方法排列若交换某两个元素的位置对结果产生影响,则是排列问题,即排列问题与选取元素顺序有关组合若交换某两个元素的位置对结果没有影响,则是组合问题,即组合问题与选取元素顺序无关7二项式定理(1)定理:(ab) nC anC an1 bC ank bkC bn(nN *)0n 1n kn n(2)通项:第 k1 项为:T k1 C ank bk.kn(3)二项式系数:二项展开式中各项的二项式系数为:C (k0,1,2
4、,n) kn8二项式系数的性质9概率与频率(1)在相同的条件 S 下重复 n 次试验,观察某一事件 A 是否出现,称 n 次试验中事件 A 出现的次数 nA 为事件 A 出现的频数,称事件 A 出现的比例 fn(A) 为事件 A 出现的频率nAn(2)对于给定的随机事件 A,在相同条件下,随着试验次数的增加,事件 A 发生的频率会在某个常数附近摆动并趋于稳定,我们可以用这个常数来刻画随机事件 A 发生的可能性大小,并3把这个常数称为随机事件 A 的概率,记作 P(A)10事件的关系与运算定义 符号表示包含关系如果事件 A 发生,则事件 B 一定发生,这时称事件B 包含事件 A(或称事件 A 包
5、含于事件 B)BA(或 A B)相等关系若 BA 且 AB,那么称事件 A 与事件 B 相等 AB并事件(和事件)若某事件发生当且仅当事件 A 发生或事件 B 发生,则称此事件为事件 A 与事件 B 的并事件(或和事件)A B(或 A B)交事件(积事件)若某事件发生当且仅当事件 A 发生且事件 B 发生,则称此事件为事件 A 与事件 B 的交事件(或积事件)AB(或 AB)互斥事件若 AB 为不可能事件,则称事件 A 与事件 B 互斥 AB 对立事件若 AB 为不可能事件, AB 为必然事件,那么称事件 A 与事件 B 互为对立事件AB ;P(A B) P(A) P(B) 111理解事件中常
6、见词语的含义:(1)A,B 中至少有一个发生的事件为 AB;(2)A,B 都发生的事件为 AB;(3)A,B 都不发生的事件为 ;A B (4)A,B 恰有一个发生的事件为 A B;B A (5)A,B 至多一个发生的事件为 A B .B A A B 12概率的几个基本性质(1)概率的取值范围:0 P( A)1.(2)必然事件的概率:P(E)1.(3)不可能事件的概率:P(F) 0.(4)概率的加法公式:如果事件 A 与事件 B 互斥,则 P(AB) P(A) P(B)(5)对立事件的概率若事件 A 与事件 B 互为对立事件,则 P(A)1 P( B)13互斥事件与对立事件的区别与联系互斥事件
7、与对立事件都是两个事件的关系,互斥事件是不可能同时发生的两个事件,而对立4事件除要求这两个事件不同时发生外,还要求二者之一必须有一个发生,因此,对立事件是互斥事件的特殊情况,而互斥事件未必是对立事件14基本事件的特点(1)任意两个基本事件是互斥的(2)任何事件(除不可能事件 )都可以表示成基本事件的和15古典概型(1)定义:具有以下两个特点的概率模型称为古典概率模型,简称古典概型试验中所有可能出现的基本事件只有有限个每个基本事件出现的可能性相等(2)古典概型的概率公式:P(A) .A包 含 的 基 本 事 件 的 个 数基 本 事 件 的 总 数16几何概型(1)定义:如果每个事件发生的概率只
8、与构成该事件区域的长度(面积或体积) 成比例,则称这样的概率模型为几何概率模型,简称几何概型(2)几何概型的概率公式:P(A) .构 成 事 件 A的 区 域 长 度 面 积 或 体 积 试 验 的 所 构 成 的 区 域 长 度 面 积 或 体 积 17条件概率及其性质(1)对于任何两个事件 A 和 B,在已知事件 A 发生的条件下,事件 B 发生的概率叫做条件概率,用符号 P(B|A)来表示,其公式为 P(B|A) PABPA nABnA(2)条件概率具有的性质:0P( B|A)1;如果 B 和 C 是两个互斥事件,则 P(BC|A)P(B|A)P(C|A)18相互独立事件(1)对于事件
9、A、B,若 A 的发生与 B 的发生互不影响,则称 A、 B 是相互独立事件(2)若 A 与 B 相互独立,则 P(B|A)P(B),P(AB)P (B|A)P(A)P( A)P(B)(3)若 A 与 B 相互独立,则 A 与 , 与 B, 与 也都相互独立B A A B(4)若 P(AB)P(A)P(B),则 A 与 B 相互独立19离散型随机变量随着试验结果变化而变化的变量称为随机变量,常用字母 X,Y,表示所有取值可以一一列出的随机变量,称为离散型随机变量20离散型随机变量的分布列及其性质(1)一般地,若离散型随机变量 X 可能取的不同值为 x1,x 2,x i,x n,X 取每一个值x
10、i(i 1,2,n )的概率 P(Xx i)p i,则表5X x1 x2 xi xnP p1 p2 pi pn称为离散型随机变量 X 的概率分布列(2)离散型随机变量的分布列的性质:p i0(i1,2 ,n) ; pi1.n i 121常见离散型随机变量的分布列(1)两点分布:若随机变量 X 服从两点分布,则其分布列为X 0 1P 1 p p其中 pP(X 1)称为成功概率(2)超几何分布在含有 M 件次品的 N 件产品中,任取 n 件,其中恰有 X 件次品,则事件X k发生的概率为 P(Xk) ,k0,1,2,m,其中 mminM,n,且CkM Cn kN MCnNnN,M N, n,M,N
11、N *,称分布列为超几何分布列 .X 0 1 mP C0M Cn 0N MCnN C1M Cn 1N MCnN CmM Cn mN MCnN(3)二项分布独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有两种结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是一样的在 n 次独立重复试验中,用 X 表示事件 A 发生的次数,设每次试验中事件 A 发生的概率为p,则 P(Xk)C pk(1p) nk (k0,1,2,n) ,此时称随机变量 X 服从二项分布,记为knXB(n ,p),并称 p 为成功概率22离散型随机变量的均值与方差若离散型随
12、机变量 X 的分布列为X x1 x2 xi xnP p1 p2 pi pn均值:称 E(X)x 1p1x 2p2x ipix npn 为随机变量 X 的均值或数学期望,它反映了离散型随机变量取值的平均水平方差:称 D(X) (xiE(X) 2pi 为随机变量 X 的方差,它刻画了随机变量 X 与其均值n i 16E(X)的平均偏离程度,其算术平方根 为随机变量 X 的标准差DX均值与方差的性质Error!(a,b 为常数)两点分布与二项分布的均值、方差X X 服从两点分布 XB(n,p)E(X) p(p 为成功概率) npD(X) p(1p) np(1 p)23.正态曲线的特点(1)曲线位于
13、x 轴上方,与 x 轴不相交;(2)曲线是单峰的,它关于直线 x 对称;(3)曲线在 x 处达到峰值 ;12(4)曲线与 x 轴之间的面积为 1;(5)当 一定时,曲线随着 的变化而沿 x 轴平移;(6)当 一定时,曲线的形状由 确定 越小,曲线越“瘦高” ,表示总体的分布越集中;越大,曲线越“矮胖” ,表示总体的分布越分散(7)正态分布的三个常用数据( 不需记忆) P(X )0.682 6; P(2X2)0.954 4; P(3X3)0.997 4.24简单随机抽样(1)定义:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(nN),且每次抽取时各个个体被抽到的机
14、会都相等,就称这样的抽样方法为简单随机抽样(2)常用方法:抽签法和随机数表法25系统抽样(1)步骤:先将总体的 N 个个体编号;根据样本容量 n,当 是整数时,取分段间隔 k ;Nn Nn在第 1 段用简单随机抽样确定第一个个体编号 l(lk) ;按照一定的规则抽取样本(2)适用范围:适用于总体中的个体数较多时26分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一7定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样(2)适用范围:适用于总体由差异比较明显的几个部分组成时27三种抽样方法的比较类别 各自特点 相互联系 适用范围 共
15、同点简单随机抽样从总体中逐个抽取 最基本的抽样方法总体中的个体数较少系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成抽样过程中每个个体被抽到的可能性相等28作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图29频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图(2)总体
16、密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线30茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指 的一列数,叶是从茎的旁边生长出来的数31样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数(2)中位数:把 n 个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数(3)平均数:把 称为 a1,a 2,a n 这 n 个数的平均数a1 a2 ann(4)标准差与方差:设一组数据 x1,x 2,x 3,x n 的平均数为 ,则这组数据x8标准差为 s 1n
17、x1 x2 x2 x2 xn x2方差为 s2 (x1 )2(x 2 )2(x n )21n x x x32变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关33两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线(2)回归方程为 x ,其中 , .y b a a y b x(3
18、)通过求 Q (yibx ia) 2 的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(4)相关系数:当 r0 时,表明两个变量正相关;当 r0 时,表明两个变量负相关r 的绝对值越接近于 1,表明两个变量的线性相关性越强r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关系,通常|r| 大于 0.75 时,认为两个变量有很强的线性相关性34独立性检验假设有两个分类变量 X 和 Y,它们的取值分别为 x1,x 2和y 1,y 2,其样本频数列联表(称为22 列联表)为:y1 y2 总计x1 a b abx2 c d cd总计 ac bd ab cdK2 (其中 nabc d 为样本容量)nad bc2a ba cb dc d