1、自由度自由度(degree of freedom, df)是指当以 样本 的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度。例如,在估计总体的平均数时,样本中的 n 个数全部加起来,其中任何一个数都和其他数据相独立,从其中抽出任何一个数都不影响其他数据(这也是随机抽样所要求的)。因此一组数据中每一个数据都是独立的,所以自由度就是估计总体参数时独立数据的数目,而平均数是根据 n 个独立数据来估计的,因此自由度为 n。但是为什么用样本估计总体的方差时,方差的自由度就是(n-1)?s2=(X-m)2/n从此公式我们可以看出总体的方差是由各数据与总体平均数的差值求出来
2、的,因此必须将 m 固定后才可以求总体的方差。因此,由于 m 被固定,它就不能独立自由变化,也就是方差受到总体平均数的限制,少了一个自由变化的机会,因此要从 n 里减掉一个。假设一个样本有两个数值,X 1=10,X2=20,我们现在要用这个样本估计总体的方差,则样本的平均数是:Xm= X/n=(10+20)/2=15现在假设我们已知 Xm=15,X1=10,根据公式 Xm= X/n,则有:X2=2Xm-X1=215-10=20由此我们可以知道在有两个数据样本中,当平均数的值和其中一个数据的值已知时,另一个数据的值就不能自由变化了,因此这个样本的自由度就减少一个,变成了(n-1)。依此类推:在一组数据中,当其平均数和前面的数据都已知时,最后一个数据就被固定而不能独立变化了,因此这个样本能够独立自由变化的数目就是(n-1)个。