一、最佳预测模型的选择自变量统计学准则

一般而言，模型中的自变量越多，残差平方和就越小，样本中的实际测量值Y与预测值Y 〈的平均误差越小（称为内推误差），然而并非自变量越多越好，当模型中引入与应变量Y无关或相关性非常弱的自变量时，残差平方和虽会减少一些，但变化却不会太大，而对于新的样本预测而言。另外模型中每增加一个自变量，在应用该回归模型时需要增加一部分收集该自变量信息的成本，因此收集那些与应变量关系非常微弱的自变量，可能得不偿失。在多重线性回归分析中，还有许多选择自变量的统计学标准，选择不同的统计学标准，最终的结果有时会不同，读者应根据实际的 ......

——《医学统计学》

书名：《医学统计学》