判定系数与调整的判定系数的关系,判定系数也叫拟合优度、可决系数,它是说明模型对样本数据的近似程度。表达式是R2=ESS/TSS=1-RSS/TSS该统计量越接近于1,模型的拟合优度越高。,在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大。 这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。,在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响: 其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。,为什么要对判定系数进行调整,未调整的判定系数会随着解释变量数量的增加而增加,即使增加的解释变量与被解释变量无关也会造成判定系数增加。而调整后的判定系数使用了自由度为一个权重因子,及时解释变量增加,如果它与被解释变量无关,则调整后的判定系数不会增加会减少可以把调整后的判定系数看作模型整体拟合优度的F统计量的一个“姊妹统计量”,它包含的信息其实是相同的。,