1、MINITAB 15 培训,统计学知识,我们进行测量,但检测方法总是有误差的,所以检测值并不是其真实值。检测值与真实值之间的差距就是评价检测方法最有决定性的指标。 但是真实值是多少,不得而知。因此怎样量化检测方法的准确性就成了难题。这也是现场工作质控的目的:保证每批结果的准确可靠。,虽然样本的真实值是不可能知道的,但是每个样本总是会有一个真实值的,不管它究竟是多少。 可以想象,一个好的检测方法,其检测值应该很紧密的分散在真实值周围。如何不紧密,那距真实值的就会大,准确性当然也就不好了,不可能想象离散度大的方法,会测出准确的结果。 因此,离散度是评价方法的好坏的 最重要也是最基本的指标。,极差,
2、最直接也是最简单的方法,即最大值最小值(也就是极差)来评价一组数据的离散度。这一方法在日常生活中最为常见,比如比赛中去掉最高最低分。,离均差,由于误差的不可控性,因此上面只由两个数据来评判一组数据是不科学的。 所以人们在要求更高的领域不使用极差来评判。其实,离散度就是数据偏离平均值的程度。因此将数据与均值之差(我们叫它离均差)加起来就能反映出一个准确的离散程度。和越大离散度也就越大。,离均差 的平方和,离均差有正有负,对于大样本离均差的代数和为零的。为了避免正负问题,在数学有上有两种方法:一种是取绝对值,也就是常说的离均差绝对值之和。 而为了避免符号问题,数学上最常用的是另一种方法平方,这样就
3、都成了非负数。因此,离均差的平方和成了评价离散度 一个指标,平均值,给定一个样本,1,3,5,7,9,平均值,X=(1+3+5+7+9)/5=5 样本的平均值为5,标准差 衡量数据分散程度 标准差(Standard Deviation) ,也称均方差(mean square error),方差 与平均值之差的平方的平均值,计算样本1,3,5,4,7的标准差,首先计算平均值:,标准差越高,表示实验数据越离散,也就是说越不精确。 反之,标准差越低,代表实验的数据越精确。,标准差是反应一组数据离散程度最常用的一种量化形式,是表示精密确的重要指标,标准差通常是相对于样本数据的平均值而定的,通常用MSD来表示,表示样本某个数据观察值相距平均值有多远。 从这里可以看到,标准差受到极值的影响。标准差越小,表明数据越聚集;标准差越大,表明数据越离散。标准差的大小因测验而定,正态分布,标准差与正态分布有密切联系:在正态分布中,1个标准差等于正态分布下曲线的68.26%的面积,1.96个标准差等于95%的面积。这在测验分数等值上有重要作用。 也就是 约 68% 数值分布在距离平均值有 1 个标准差之内的范围 约 95% 数值分布在距离平均值有 2 个标准差之内的范围, 约 99.7% 数值分布在距离平均值有 3 个标准差之内的范围。 称为 “68-95-99.7 rule“。,