实际工作中数据集都存在干扰和随机误差。对于大量数据,一个或多个极端值产生的原因可能有两个:①样本中包含错误值或离群值。分布存在重尾,即其概率密度函数下降趋势比正态(如对数‐正态)函数慢。如果极端值的存在是后一种情况,该样本仅是总体内在情况的一个反映。也有可能两种原因都存在:离群值可能出现在重尾分布的总体样本中。有的极值出现在数据的一端,经常在较大值的一端,这种趋势的总体和样本会右偏。数据呈严重的右偏分布,原始数据的直方图无法进行描述,不能显示任何特征。图7‐8墨西哥裔美国人中女性和男性的γ‐GT分布。 ......