在许多化学领域问题的研究中,需要收集和分析表现所研究对象的物质体系特征或过程系统运行状态的大量数据及信息。如何将隐没在大规模原始数据海洋中的重要信息和特征(feature)集中提取出来。如何揭示高维复杂数据群体的内在规律性。如何辨识对象系统的本质特征并掌握系统组成及各要素间的相关性,这是多元统计分析技术所研究的主要问题。利用数学和统计学方法对多维复杂数据群体进行科学分析的理论和方法是多元统计分析研究的基本内容。在对变量进行聚类分析时,先要确定变量的相似系数,即确定变量的相似性测度方式,然后采用样本点聚。
……