SPSS作聚类分析

发布时间 : 星期日 文章SPSS作聚类分析更新完毕开始阅读

3. 选择聚类方法

确定了样品或变量间的距离或相似系数后,就要对 样品或变量进行分类。分类的一种方法是系统聚类法 (又称谱系聚类);另一种方法是调优法(如动态聚 类法就属于这种类型)。此外还有模糊聚类、图论聚 类、聚类预报等多种方法。

我们主要介绍系统聚类法(实际应用中使用最多)。 系统聚类法的基基本思想是:令n个样品自成一类,计 算出相似性测度,此时类间距离与样品间距离是等价 的,把测度最小的两个类合并;然后按照某种聚类方 法计算类间的距离,再按最小距离准则并类;这样每 次减少一类,持续下去直到所有样品都归为一类为 止。聚类过程可做成聚类谱系图(Hierarchial

电子科技大学应用数学学院 diagram)。

1) 系统聚类法的产生

系统聚类法的聚类原则决定于样品间的距离(或相 似系数)及类间距离的定义,类间距离的不同定义就 产生了不同的系统聚类分析方法。 2) SPSS中如何选择系统聚类法

从Cluster Method框中 点击向下箭头,将出 现如左可选项,从中 选一即可。

电子科技大学应用数学学院

3) 常用系统聚类方法

a) Between-groups linkage 组间连接 方法简述:合并两类的结果使所有的两两项对之间 的平均距离最小

特点:非最大距离,也非最小距离

b) Within-groups linkage 组内连接

方法简述:两类合并为一类后,合并后的类中所有 项之间的平均距离最小 特点:

电子科技大学应用数学学院

c) Nearest neighbor 最近邻法(最短距离法) 方法简述:首先合并最近或最相似的两项

特点:样品有链接聚合的趋势,这是其缺点,不适 合一般数据的分类处理,除去特殊数据外,不提 倡用这种方法。

d) Furthest neighbor 最远邻法(最长距离法) 方法简述:用两类之间最远点的距离代表两类之间 的距离,也称之为完全连接法

特点:

电子科技大学应用数学学院

联系合同范文客服:xxxxx#qq.com(#替换为@)