聚类分析(cluster analysis)是按“物以类聚”的原则将特性相近的变量或观察单位进行归类。聚类分析可分为变量聚类和样品聚类两类,前者又称指标聚类或R型聚类。其前提条件是各变量相互独立,服从多元正态分布(对于连续型变量)或联合多分类正态分布(joint multinomial‐nor mal distribution,对于同时具有分类变量和连续型变量时)。将参加聚类分析的6个变量按分类变量(title,educ,dept)和连续型变量(age,year1,year2)分别选入Categorica ......