1、统计技术应用培训,第一章 概 述第一节 2000版标准对统计技术的要求,一、统计技术是质量管理体系的基础 我国大部分组织跨越了统计质量控制阶段。 统计技术的应用一直是各组织普遍存在的一个薄弱环节。 统计技术的应用涉及QMS各个过程,是QMS中的一项基础。,二、统计技术的作用 (可结合ISO 9000标准 2.10理解)l 研究对象是“变异”,变异(生):“同一起源的个体性 状差异”。 l “变异”是客观存在。 l 变异具有不同性质:正常变异和异常变异。 l 变异具有一定的统计规律。l 统计技术有助于对变异进行测量、描述、分析和建立模型。 l 数据分析能帮助理解、分析变异的性质、程度和原因。 统
2、计技术有助于提高QMS 的有效性和管理效率;有利于预防和解决因变异引起的问题,促进持续改进;有利于利用信息并作为决策依据。,第二节 数据和信息,一、数据分类 1计量型数据 作为连续量测得的质量特性值。 2技术型数据 非连续性取值的质量特性值。 l 不同类型的数据,反映了不同的统计性质和不同的数 据分析方法。 在质量评定中,还存在一种特殊“量”官能量,官 能量多具模糊性,但它是可以感知的,必要时也是可以量化的。,二、数据的要求,1 针对性 2 完整性 3 准确性 4 及时性 5 连续性 6 统一性,三、与数据有关的术语和概念,l 记录:“阐明所取得的结果或提供所完成活动的证据的文件” (3.7.
3、6)。l 客观证据:“支持事物存在或其真实性数据”(3.8.1)。l 信息:“有意义的数据”(3.7.1)。l物流:将资源的输入转化为产品的输出而进行形态(物理的) 和性质(化学或生物的)变化的运动过程。l 信流:伴随物流而产生的,它反映了物流状态,并通过它控制、 调节、改进物流。l一次信息源:一般指未整理分析的原始记录或信息。 二次信息源:经整理分析并可利用的数据或信息。,第三节 统计技术中的有关概念,一、什么是统计技术 是研究事物变异性及其规律性的科学,通常分:l推断性统计技术l描述性统计技术二、总体、个体和样本l总体:亦称母体,是研究对象的全体。 总体可以是有限的,也可是无限的。l个体:
4、组成总体的每一个单元。l 样本:从总体中抽取的部分个体。l 样品:样本中的个体。 l 样本容量,亦称样本大小:指样本中所包含个体的数量。,三、生产批与检验批l生产批:过程受控状态下连续生产的一批产品;一批产品包含的产品单位个数称批量。l检验批:待检验的一批产品。 四、事件l必然事件:一定条件下,必然发生的事件。l不可能事件:一定条件下,不可能发生的事件。l随机事件:一定条件下,可能发生,也可能不发生的 事件。小概率事件:发生概率很小(一般小于0.05)的事件, 在有限次试验中小概率事件是可以忽略的。,五、频数、频率和概率 l 频数ni 随机事件在一组数据或多次试验出现的次 数,或不同数据落在某
5、区间的个数。 l 频率fi 随机事件在观察总次数中所占比率。 l 概率P(A)频率的稳定值。 六、系统误差和随机误差 l 产品误差:指产品特性的目标值和实测值之差。 l 系统误差:特性值的总体均值与目标值之差。 l 随机误差:特性值与总体均值之差。,第一节 数据的离散性和规律性 例2.1 一个生产电发火管产品的工厂,检验规定要求抽查100件电发火管作爆破试验,其数值如表2.1: 表2.1电发火管爆破压力试验数据,表2.1中数据提供的信息是有限的,但仍可看出数据所具有的两个重要特性:,1 离散性 2 规律性,第二节 数据的特征值一、位置特征值 常用的数据位置特征(中心趋向)的值是:l 平均值 (
6、2.1)l 中位数 按序排列的居中值,或居中两个数据的平均值。,二、离散特征值 常用的离散特征值有: l极差R R=X最大-X最小 (2.3) R用于每组测定个数几小于10的场合 l标准差S (2.6) 注:提纲中图、表和公式出现空号,是为了与教程 编号一致。,第三节 数据的频数分布和直方图 一、频数分布表(以表2.1数据为例) 1计算数据的变化范围,R = 101.9 75.2 = 26.5 2按K表(2.2)确定组数,选K=9 3计算组距 本例选3.0 4确定边界值 5统计得表2.3 表2.3 频数分布表,二、频数直方图 频数直方图是频数分布表的图示形式。 频数直方图以各组边界值画横轴(数
7、轴),纵轴为频数,画出以组距h为宽,频数ni为高的一个一个直方,即为直方图(图2.2)。 按教程17页图2.2作图,第三章 质量变异的规律性分析 第一节 概率分布,可以设想,如果我们取更多的样本个数,组分得更细,直方图的轮廓线的阶跃也就越小。 当n,h0时,直方图趋于一条光滑的曲线(图3.1)。图3.1 当n,h0时,直方图趋于一条光滑的曲线分布曲线 这条曲线排除了抽样误差和测量误差,完全反映了产品质量的波动规律。 这种反映产品质量规律的曲线称为分布密度曲线。 描述分布密度曲线的表达式称为分布密度函数。,第二节 正态分布,当质量特性(随机变量)由为数众多的因素影响,而又没有一个因素起主导作用的
8、情况下,该质量特性值的变异分布,一般都服从正态分布。 一、正态分布特点图3.2 正态分布曲线1.曲线最高点的横坐标,称正态分布的均值,用表示。2.曲线以为对称轴。,3.用数学模式表达正态分布曲线(称正态分布密度函数):, x Za,则认为0。 2检验1=2 此时需计算统计量: (4.3) 其它几种显著性检验可根据表4.1进行。,第五章 过程控制和统计过程控制第一节 基本概念 一、质量控制和过程控制 l 质量控制是质量管理的一部分,其目的是“致力于满足 质量要求”。 l 过程控制是用“过程方法”对过程进行控制,其目的是 使过程保持稳定并进而持续改进过程。 二、统计过程控制 用统计技术进行过程控制
9、,称统计过程控制,简称SPC。,第二节 过程能力及过程能力指数 一、过程能力 l 过程能力是指当过程处于统计控制状态,过程输出符 合容差范围的能力。 l 过程能力一般用特性值散布的6倍标准差(6)衡量。 过程能力的应用前提是,质量特性能用数据表征,且处 于统计控制状态。 l统计控制状态是保证过程稳定的基础。 l用6度量过程能力在理论上是经济和合理的。 l过程能力是过程客观存在的一种固有能力。 l 过程能力是5 M I E的综合结果。,二、过程能力指数 通常将允许的容差范围除以6的比值,称为过程能力指数。 当= M,称过程能力“无偏”,用Cp表示;不一致时,称“有偏”, 用Cpk表示。 1双边容
10、差无偏情况 Cp= (5.1) 2双边容差有偏情况 当 M时,式(5.1)需乘上一个修正系数(1- K)。 K= 。其中= |M |。 计算式为: Cpk=(1K)Cp =(T2)/6 (5.2),3容差限为单边的情况 Cp = (5.3) 图5.1是上述几种过程能力指数的示意图及其计算公式。,第三节 过程能力指数与不合格品率 一、过程能力与容差限 标准差反映了在正常生产条件下产品特性值的散布,是衡量质量是 否稳定的标志。 容限差是根据实际情况需要人为规定的一个区间。 二、过程能力指数与不合格品率 当容差中心M与数据散布中心重合(M = )时可根据式(5.4)计 算并查附表一得出不合格品率P:
11、 P =2 2 (3 Cp) (5.4) 对于容差中心与分布中心不重合(M )时,不合格品率P由过程 能力指数Cp以及K值决定,如式(5.5): P =2 3 Cp(1 + K)+3 p(1 K) (5.5),第四节 影响过程能力的因素及其要求 过程质量及其控制,主要取决于6个因素,即: 人(Man) 机(machine) 料(material) 法(method) 测(measurment) 环(invironment) 简称5 M I E。 在这6个方面,GB/T 190012000标准都有明确要求。,第五节 过程分析方法 过程分析方法,包括统计分析方法和技术分析方法,本节仅重点介绍几种常
12、用的描述性分析图表。,一、构思图 1什麽是构思图 构思图是一种记录和分析信息的图示技术,主要用于策划一项新任务或 新过程。 2如何作构思图(课堂演示) 3构思图优点 (1)主题明确,不会偏离主题; (2)层次清楚,离开主题越近的因素,关系越直接; (3)反映迅速,能充分开发大脑功能; (4)能反映因素间、以及不同层次因素与主题间的关联性; (5)信息量大,而且可以不断完善; (6)不同的构思图可取长补短; (7)完整的记录,帮助回忆; (8)允许自由构想,发挥创造性。 本节涉及的其它过程分析方法包括:分层法、调查表、排列图、因果图等,第一节 控制图原理 控制图是将一个过程定期收集的样本数据按顺
13、序点绘而 成的一种图示技术。 控制图可展示过程变异并发现异常变异,并进而成为采 取预防措施的重要手段。 任何反映产品或过程特性的变量(计量数据)或属性 (计数数据)都可以绘制控制图, 前者称计量型控制图,后者称计数型控制图。,第六章 监视和控制过程的工具控制图,一、3原则 一个控制图通常有3条线: 1 中心线,简称CL线;其位置与正态分布均值重合。 2 上控制线,简称UCL;其位置在+ 3处。 3下控制线简称LCL,其位置在- 3处。 如果将正态分布曲线6.1a,向右旋转90 ,3条线位置如图6.1b。 图6.1,二、两类错误的概率 1错判是虚发警报的错误,也称第类错误。 2漏判是漏发警报的错
14、误,也称第类错误。三、控制图的设计思想 所以将上、下控制限定在3处,目的是使两种 错判率总损失达到最小。 休哈特控制图的设计思想是:先确定第类错误, 而且将取得很小 ( 2.73)。 为控制第二类错误,则增加了对界限内点子趋向判 异准则。,四、过程异常判断的基本思路 l多数点子在1范围内,小部分点子在2和 3之间,而且点子呈随机排列,这是过程 控制的 理想状态。 l中心线一侧的点子明显比另一侧多,这时应考虑均值 可能产生偏移。 l较多的点子接近上、下控制限,说明标准差已经变大 中心线一侧连线出现多个点子或点子连续上升(或下 降)证明有系统因素干扰。,一、 -R图 1 特点 l 两种图联合使用
15、l应用范围广,当4或5时, 都近似服从正态分布, 只要总体分布不是太不对称,R的分布不会有太大的变 化。 l灵敏度高,通过平均作用,反映在x上的随机偶然波 动会得到一定程度的提高。 l由于与通常未知故需用它们的估计值、代替、,第二节 计量型控制图,2中心线和上下控制限的确定 图 CL = = UCL = + 3 =+ + + = A2R UCL = + 3 =- + + = A2R R图 CL=R= UCLR=R + 3R + 3d3/d2 = D4 UCLR=R- 3R - 3d3/d2 = D4 3. 作图答案(教程第63页),二、 - S图 l当n较大,利用极差估计标准差其效率较低,此时
16、 常用S估计。 l可以证明:S = l S图又可分为总体标准差已知和未知两种情况。,三、单值移动差(x-RS)控制图 l x-RS 控制图主要用于下述场合: (1) 希望尽快发现并消除异常原因; (2) 从过程中只能获得1个测定值; (3) 产品一致性好,不需测多个值; (4) 因费用、时间或产品批量小等限制只能得到一个测定值时。 l x图的优点是可将测定值直接在图上打点,不需计算。 l 缺点是不易发现质量分布的平均变化。 l由于x图每次仅能取一个数值,可用相邻数据之差的 绝对值(称“移动差”,记RS)来代替RRSi = | xi xi+1 | 查表6.1当n = 2时,d2 = 1.128,
17、D3 = 0,D4 = 3.267 故3/d2 = 3/1.128 = 2.660 中心线与控制限(见教程第67页),第三节 计数型控制图 常用的计数型控制图有控制不合格品率(百分率)的P控制图、控制缺陷数的C控制图等。 和计量型控制图一样,都按“3”原则确定控制限,只不过由于分布的类型不同,对均值和标准差采用了不同的计算公式罢了。一、缺陷数(C)控制图 当计数检验的个数相对于被检验的对象的总体很少时,通常采用C图。 C图经常用于控制产品的疵点,故也称疵点控制图。 C图的控制限公式可近似为: UCL = + 3 (6.14) LCL = - 3,中心线 =,二、百分率(P)图 当计数的数所占的
18、比例较大时,可以把它们折成百分率,这类数据称百分率数据,简称P数据。用P数据作出的控制图称百分率控制图,简称P图。当 已求得时,控制限的近似公式为: P的控制上限 = + 3 (6.15) P的控制上限 = - 3,中心线 =,第七章 分析变量之间相关性方法 回归分析 l变量相互间的关系是不同的。 一种是变量之间有完全确定的关系(函数关系),另一种 是变量之间具有相关关系。 l函数与相关这两种不同类型的变量关系之间并没有严格界 限。 l相关分析主要解决以下三方面问题: 1、确定特定的变量之间是否存在相关关系; 2、根据一个或几个变量值预测或控制另一个变量的取值 3、确定影响变量的多个因素中的主
19、要因素。,第一节 散布图 一、散布图概念 散布图,是用来分析两个相应变量之间是否存在相关关 系一种图示方法。 (课堂举例) 二、几种典型的散布图(结合教程图7.2讲解),第二节 回归分析的解析方法 一、解析分析与散布图比较 l 解析法的优点包括: 1可以使散布图上各个描点相对于直线的总误差最小。 2可以用一个统计量和一个标准系数(称相关系数)的 比较来衡量变量的相关性。 3散布图一般只用于两个变量的相关分析,而解析法可 以用于多变量的情况。 4必要时,可结合控制图思想,对两个相关变量进行控 制。 l解析法的局限性在于: 直观性不如散布图。 也不利于发现非线性相关。,二、回归直线的确定 计算回归
20、直线的方法叫最小二乘法。 利用极值原理可以推得直线方程中a,b的计算式: (7.2) 三、回归方程的计算(见教程),a=,第三节 相关系数和相关性检验 判断两变量是否相关,主要依据物理分析及有关人员的经验。 数学上有一种辅助办法,引进一个叫相关系数的量,以r表示: (7.4) r的取值范围:0 |r| 1。它反映了两变量间线性关系的密切程度。,例7.2 试检验表7.1中两变量(流量和推力)之间的相关系数,选显著性水平a=0.05 解: 第一步:按式(7.3),分别计算: Lxx = 0.4920 Lyy = 5.5765 Lxy = 1.4441 第二步:将数据代入式(7.4)得统计量r为:
21、第三步:当f = 12-2 = 10,a = 0.05时,查附表(十一)得a = 0.576 第四步:比较: 今|r|ra,因此可判为两变量是相关的。,第八章 抽样检验方法第一节 概述一、什么是检验 检验的定义是:“通过观察和判断,适当时结合测量、试验所进行的 符合性评价”(3.8.2)。二、为什么要进行抽样检验 当产品的批量较大时,实践证明,全检未必比一个合理抽检方案效 果理想。 全数检验的投入要比抽检高得多。 产品的破坏性检验、市场的监督检验、质量审核等也只能进行抽样 检验。,三、制订和实施抽样检验方案前的准备工作 所谓抽样方案,是为了实行抽样检验而确定的一组规则。 一个抽样方案应规定如何
22、抽取样本,抽取多大样本,以及决定是 否接收的判断准则等。 1 单位产品 2 检验批 3 单位产品质量 4 检验器具 5 检验工位 6 检验人员 7. 检验文件,抽检n件,有r件不合格品,若r c接收,若r c拒收,图8.1 一次抽样框图,第二节 抽样检验的统计原理一、什么是抽样方案 计数型一次抽样,常用两数字(n,c)表示。 (n,c),对于二次抽样,可以抽取两样本(n1,n2), 相应有两个合格判定数(c1,c2)。 (n1,n2, c1,c2),抽检n1件,有r1件不合格品,若r1 c1接收,若c1 c2拒收,若r1 +r2c2接收,若r1 +r2 c2拒收,图8.2 二次抽样框图,二、抽样方案接收概率 在一个(n,c)的抽样方案中,只有样本中不合格品数 rc时才能判为合格而被接收。 若以p(r)表示样本中恰有r件不合格品的概率,则接收 概率L(p)为: L(p) = p(r=0)+ p(r=1)+ p(r=c) 按式(3.10)计算rc的接收概率 L(p) = p (xc),