1、1一、数据的特征值(一)数据的位置特征值1)平均值 如果从总体中抽取一个样本,得到一批数据 x1,x 2,x 3.xn,则样本的平均值 x 为:n-数据个数;xi-第 i 个数据数;-求和。2)中位数 有时,为减少计算,将数据 x1,x 2,x 3.xn 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。3)中值 M测定值中的最大值 xmax 与最小值 xmin 的平均值,用 M 表示。4)众数在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。(二)数据的离散特征值1)极差
2、 R测定值中的最大值 xmax 与最小值 xmin 之差称为极差。通常 R 用于个数 n 小于 10 的情况下,n 大于 10 时,一般采用标准偏差 s 表示。2)偏差平方和 S各测定值 xi 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用 S 表示。无偏方差各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差) ,用 s2 表示:niixx1_2minma_niixnSs 12_2 )(1 2_2_221 )(.)()( xxnniix1_S =2标准偏差 s方差 s2 的平方根为标准偏差(简称标准差) ,用 s 表示:(三)变异系数以上反映数据离
3、散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上用变异系数 CV 来表达:上式中 和 为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差 s 和样本均值 估计。niixnS12_)(1_xsCV_3Ca、Cp、Cpk 的计算过程准确度指数(Ca 值): 表示过程特性中心位置的偏移程度,越小越好Ca=(样本平均值-规格中心值)/(规格公差/2 )等级 A:|Ca|12.5% 表示作业员遵守作业规范,并达规格要求等级 B : 12.5%1。一般情况下,当 CP=1.33, T=8
4、,整个分布基本上都在上下规范限度内,且留有变动空间。故 ISO8258:1991 要求 CP1.33。2、只对单侧公差限有规定时只规定上限时,只规定下限时,66LUP TC过 程 变 异 度规 定 的 公 差 3UPTCLP9当产品质量特性分布的均值 与公差中心 M 有偏离时这种情况下,需要对无偏离 CP 乘上一个修正系数(1-K ) 。有偏离情况下的过程能力指数是:过程能力指数与不合格品率的关系考虑过程能力指数与不合格品率的关系时,直接查正态分布表比较方便。当公差中心 M 与数据分布中心 重合时,当公差中心 M 与数据分布中心 有偏离时,例:在无偏离情况下,求 CP=0.7 时的不合格品率
5、P。解答:CP=0.7, 3 CP=2.1查“正态分布表” ,得到 不合格品率为:P=2-2 x 0.98214=0.035726.4.3.3 6 控制方法6 控制方法,即过程能力指数达到 2 以上,不合格品率 0.08197316, 几乎达到零缺陷。执行 6 需要多方面的专业技能和知识,包括:SPC、MSA、DOE、可靠度工程、FMEA、TQM、 QFD、田口方法、 ISO9000、质量成本 QCOST、数理统计、顾客满意、同步工程、价值工程、绿色设计等等。所用的工具可以是: SPC 度量、分析、改进和监控过程的波动 DOE/田口方法 优化设计技术,通过 DOE,改进过程设计,使过程能力达到
6、最优水平 FMEA 风险分析技术,辅助确定改进项目,制定改进目标 QFD 顾客需求分析技术,辅助将顾客需求正确地转换为内部工作要求 防错 从根本上防止错误发生的方法 62)1(TCKPP)3(2P66LUP T过 程 变 异 度规 定 的 公 差 KK131)(298214.0).(10平均值加减标准差表示的是什么标准差,标准差的平方是方差,方差就是为了统计这组数据偏离平均值的程度,也可以说是这组数据的稳定性。例如两个人打靶,A 打 6,7,8,9,10,平均值是 8,方差就是(-2)2+(-1 )2+0+12+22/5=2,标准差等于根号 2B 打 8,8,8,8,8,平均值是 8,方差就是
7、 0,这样来说 B 的成绩更稳定。平均数加减标准差的范围内代表大概率事件,范围外代表小概率事件。用成绩为样本,则范围内的成绩为正常的大部分考生的成绩,范围外的为特殊的少部分考生的成绩(包括特别好的和特别差的)。通常,一次考试的成绩都是成正态分布的,平均数加减标准差的范围内的成绩应该达到 85%以上。如果没有成正态分布,则说明试卷没有出好,出得太难或者太简单了。对某一个人所有考试的成绩看平均数和标准差就够了,对平均数加减标准差的分析没有多大意义。但是,某一个人在一段时间内某一特定科目的所有考试成绩又可以用平均数加减标准差来分析了。平均数只能显示总体情况,而标准差能够看出变异程度。标准差越大,数据
8、越离散。比如以下两组数:a. 2 2 2 2 2 b.1 1 2 3 3 两组的均数相等,而 a 组数据集中(向均数集中) ,b 组离散,a 组标准差小于 b 组11P 值与 值的关系?P 值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。 值是一个临界概率值。它表示在“统计假设检验”中,用样本资料推断总体时,犯拒绝“假设” 错误的可能性大小。 越小,犯拒绝“假设”的错误可能性越小。P 是“拒绝原假设时犯错误概率”又或者说是“如果你拒绝掉原假设实际上是在冤枉好人的概率”。不管怎么表达理解上都有点绕,所以你还是看例子吧。比如你做一个假设( null hypothesis):你的女性朋友平均身高 2 米,输入你统计的样本数据后,计算机给你返回的 p 值是 0.03。这意味着如果你拒绝“女性朋友平均身高 2 米” 这个结论,犯错的概率是 0.03,小于 0.05(人们一般认为拒绝一句话时犯错概率小于 0.05 就可以放心大胆地拒绝了),这个时候你就可以拒绝原假设。如果计算机返回 p 值是0.9,那么你就会想,这说明拒绝原假设犯错概率高达 90%,那么我就不应该拒绝原假设,即你应该认为你的女性朋友平均身高就是 2 米。至于什么是 alpha 呢,上面例子中 0.05 这个标准就是 alpha 值,这个标准是可以你自己人为改变的。=以下是补充内容=