1、标准差与标准误的区别2009 年 05 月 23 日 星期六 下午 09:26标准差表示数据的离散程度,或者说数据的波动大小。标准误表示抽样误差的大小。统计教材上一般都写标准误表示均数的抽样误差,这对于初学者很难理解。这里通过举例来说明含义。比如,有一个学校,学校中共有 1000 名学生,则这 1000 名学生可以作为这个学校学生的总体。如果我想了解所有学生的身高,采用随机抽样,抽取了 50人。这 50 人就是一个样本。这里需要注意:一个样本并不是指一个人,而是指一次抽样。一个样本可以是 1 个人,也可以是 100 人,这里的 1 和 100 就是样本大小。从理论上讲,抽样误差表示这样的意思:
2、即如果不止抽样一次,而是抽样 10次,每次都 50 人,那么我就有 10 个均数和标准差。例如下图,大圈代表总体1000 人,一个小圈代表一个样本,即 50 人。每个样本都能计算计算一个均数和标准差。以这 10 个均数作为原始数据,仍然能计算出一个均数和标准差,以这 10 个均数计算出的标准差就称之为标准误。这是理论上的含义,实际的含义就代表抽样误差的大小,即抽取的样本代表性好不好,抽样误差越小,代表性越好,反之,代表性越差。如果我对学校中的 1000 人都测量了身高,那理论上就没有标准误,也就是没有抽样误差了,因为我测量了总体,这时就不存在标准误了。但是标准差是存在的,因为这 1000 人的
3、身高肯定不同,肯定会有波动。这里就充分表明了标准差和标准误的区别了。标准误的进一步阐释前面已经对标准误做了简单的介绍,并将其与标准差的区别做了比较。最近几天发现,通过百度搜索“标准误”而找到本空间的人特别多,故这里对标准误进一步进行阐述。大多数统计教材都是在 t 检验的章节里开始介绍标准误,给定的概念大致为“样本均数的标准差就称之为均数的标准误”。这句话其实说的比较模糊,初学者很容易犯迷糊。其实,标准误最通俗的理解就是“抽样误差”。标准误大,表示抽样误差大,标准误小,表示抽样误差小。标准误是伴随整个的统计分析方法之中的,并不是仅限于 t 检验等方法。只要有参数估计存在,就有标准误的伴随。只要有
4、样本,就会有标准误。只要目的是为了从一定的样本中推论总体,就一定会有标准误。比如,在多元线性回归分析、logistic 回归分析、cox 回归分析中,分析结果都会出现参数估计(parameter estimation)和标准误(standard error)。在这些多因素回归分析中,标准误对我们有什么提示呢?当然,其含义仍然是抽样误差,但它可以给我们一些更加实际的提示:如果标准误远远大于估计的参数值,这一般是提示你的样本含量太小,需要加大样本,或者减少一些变量。否则,即使结果出来了,也不准确。甚至会给我们以误导。所以说,统计分析不要仅看一个 P 值,P 值所提供的信息是有限的,P 值仅是告诉你
5、,你的结果犯错的风险有多大。只有结合其他的指标,才能有一个准确而可靠的专业结论。标准差与标准误的区别2009 年 05 月 23 日 星期六 下午 09:26标准差表示数据的离散程度,或者说数据的波动大小。标准误表示抽样误差的大小。统计教材上一般都写标准误表示均数的抽样误差,这对于初学者很难理解。这里通过举例来说明含义。比如,有一个学校,学校中共有 1000 名学生,则这 1000 名学生可以作为这个学校学生的总体。如果我想了解所有学生的身高,采用随机抽样,抽取了 50人。这 50 人就是一个样本。这里需要注意:一个样本并不是指一个人,而是指一次抽样。一个样本可以是 1 个人,也可以是 100
6、 人,这里的 1 和 100 就是样本大小。从理论上讲,抽样误差表示这样的意思:即如果不止抽样一次,而是抽样 10次,每次都 50 人,那么我就有 10 个均数和标准差。例如下图,大圈代表总体1000 人,一个小圈代表一个样本,即 50 人。每个样本都能计算计算一个均数和标准差。以这 10 个均数作为原始数据,仍然能计算出一个均数和标准差,以这 10 个均数计算出的标准差就称之为标准误。这是理论上的含义,实际的含义就代表抽样误差的大小,即抽取的样本代表性好不好,抽样误差越小,代表性越好,反之,代表性越差。如果我对学校中的 1000 人都测量了身高,那理论上就没有标准误,也就是没有抽样误差了,因
7、为我测量了总体,这时就不存在标准误了。但是标准差是存在的,因为这 1000 人的身高肯定不同,肯定会有波动。这里就充分表明了标准差和标准误的区别了。标准误的进一步阐释前面已经对标准误做了简单的介绍,并将其与标准差的区别做了比较。最近几天发现,通过百度搜索“标准误”而找到本空间的人特别多,故这里对标准误进一步进行阐述。大多数统计教材都是在 t 检验的章节里开始介绍标准误,给定的概念大致为“样本均数的标准差就称之为均数的标准误”。这句话其实说的比较模糊,初学者很容易犯迷糊。其实,标准误最通俗的理解就是“抽样误差”。标准误大,表示抽样误差大,标准误小,表示抽样误差小。标准误是伴随整个的统计分析方法之
8、中的,并不是仅限于 t 检验等方法。只要有参数估计存在,就有标准误的伴随。只要有样本,就会有标准误。只要目的是为了从一定的样本中推论总体,就一定会有标准误。比如,在多元线性回归分析、logistic 回归分析、cox 回归分析中,分析结果都会出现参数估计(parameter estimation)和标准误(standard error)。在这些多因素回归分析中,标准误对我们有什么提示呢?当然,其含义仍然是抽样误差,但它可以给我们一些更加实际的提示:如果标准误远远大于估计的参数值,这一般是提示你的样本含量太小,需要加大样本,或者减少一些变量。否则,即使结果出来了,也不准确。甚至会给我们以误导。所
9、以说,统计分析不要仅看一个 P 值,P 值所提供的信息是有限的,P 值仅是告诉你,你的结果犯错的风险有多大。只有结合其他的指标,才能有一个准确而可靠的专业结论。关于标准差的理解2008-11-07 10:50大多数的杂志都会要求连续资料以“均数加减标准差”的形式来表示。均数大家都比较好理解,就是平均值。标准差对于初学者或许有一定的理解难度。标准差实际上就是反映了数据的波动情况,标准差越大,表明数据之间差别越大,比如,均数为 10,标准差为 3 时,图形为其中,横线为均数,波动的程度就是标准差,如果均数仍为 10,标准差变为 6,这时的图形为两个图形一对比,你就可以发现,第二个图比第一个波动程度大得多。这就是标准差的直观含义。那么标准差有什么现实意义呢?实际中,如果你的抽样数据标准差很大,表明可能你选取的样本不稳定,或者说代表性不好。比如,你要了解你们班同学的平均身高,共抽取了 2 人,结果一人是 160,一人是 180,而你们班的平均身高可能是 170,160 和 180 相差就太大,也就是说,你抽取的人代表性不好,没有反映出你们班 170 的平均水平。