- 聚类任务的标准定义:
-
聚类结果的性能度量:同一簇相似度高,不同簇相似度低。
A.内部指标:
B.外部指标: -
距离计算:
距离度量的定义
闵科夫斯基距离
欧式距离 (p=2)
曼哈顿距离 (p=1)
对于无序属性采用VDM距离
综合起来处理: - 基于原型的聚类:k均值算法
- 基于密度的聚类: DBSCAN算法
- 基于层次的聚类:AGENT算法
聚类结果的性能度量:同一簇相似度高,不同簇相似度低。
A.内部指标:
B.外部指标:距离计算:
距离度量的定义
闵科夫斯基距离
欧式距离 (p=2)
曼哈顿距离 (p=1)
对于无序属性采用VDM距离
综合起来处理: