单链:
定义:两个簇的邻近度为两个簇中的任意两个点之间的最短距离
计算公式:dist({m1,m2},{m3,m4})=min(dist{m1,m3},dist{m1,m4},dist{m2,m3},dist{m2,m4})
特点:单链技术擅长处理非椭圆形的簇,但对噪音和离群点很敏感。
全链:
定义:两个簇的邻近度为两个簇中的任意两个点之间的最长距离
计算公式:dist({m1,m2},{m3,m4})=max(dist{m1,m3},dist{m1,m4},dist{m2,m3},dist{m2,m4})
特点:全链技术擅长处理圆形的簇,但对噪音和离群点不太敏感。
组平均:
定义:两个簇的邻近度为两个簇中的任意两个点之间的平均距离
计算公式:dist({m1,m2},{m3,m4})=(dist{m1,m3}+dist{m1,m4}+dist{m2,m3}+dist{m2,m4})
÷
\div
÷ 4
输入:n个对象,终止条件簇的数目k
输出:k个簇,达到终止条件规定簇数目