极端值,也称异常值、离群值,即异常大或异常小的数据值。在对数据集分析时,这些异常的极端的数值与其他数据远远分开,可能引起较大的误差,影响数据的有效性和稳健性。因此,检测和确认极端值是检查数据有效性的常用手段。在未弄清楚极端值产生的原因之前,不应简单决定取舍,特别是当测量数据较少时,极端值的取舍对分析结果会产生很大影响,必须慎重对待。对二维或三维变量的极端值的识别,可描绘其散点图,根据散点图发现可疑极端值。Lunneborg建议用如下公式判别极端值:式中, n为样品个数,如果,则认为第i个样品为极端值,应予 ......