一般而言,模型中的自变量越多,残差平方和就越小,样本中的实际测量值Y与预测值Y 〈的平均误差越小(称为内推误差),然而并非自变量越多越好,当模型中引入与应变量Y无关或相关性非常弱的自变量时,残差平方和虽会减少一些,但变化却不会太大,而对于新的样本预测而言。另外模型中每增加一个自变量,在应用该回归模型时需要增加一部分收集该自变量信息的成本,因此收集那些与应变量关系非常微弱的自变量,可能得不偿失。在多重线性回归分析中,还有许多选择自变量的统计学标准,选择不同的统计学标准,最终的结果有时会不同,读者应根据实际的 ......