当前位置：首页 > 面试题库 >

k-means除了随机选择初始质心，还有什么方法？

慕璞

2023-03-14

本文向大家介绍k-means除了随机选择初始质心，还有什么方法？相关面试题，主要包含被问及k-means除了随机选择初始质心，还有什么方法？时的应答技巧和注意事项，需要的朋友参考一下

多次运行，每次使用一组不同的初始质心，计算平方误差，选择最小的作为初始质心
使用层次聚类，找到k个簇的质心，以这个质心作为初始质心
先随机选择一个初始质心，然后找到后继质心，即找到距离这个质心最远的点作为新的质心，这样就保证了选择初始点的随机性以及是散开的

类似资料：

更新质心值k-means

我正在尝试使用python从头开始实现一个k-means聚类算法。我在更新每个簇的质心值时遇到问题。下面的代码显示了到目前为止我所处的位置。我最初将每个数据点聚类为k个聚类中的一个。所有数据包含329行；每一行是一个单词，后跟300个特征，后面是它被分配到的集群的编号（值1到4）。我在循环中尝试做的是首先创建一个数组A，该数组只保存分配给第一个集群的AllData中的行。然后我想取A中每个特征列的
知道什么是k-means？k-means是否一定收敛，k的选择？

本文向大家介绍知道什么是k-means？k-means是否一定收敛，k的选择？相关面试题，主要包含被问及知道什么是k-means？k-means是否一定收敛，k的选择？时的应答技巧和注意事项，需要的朋友参考一下算法流程： 1.选择聚类的个数k（kmeans算法传递超参数的时候，只需设置最大的K值） 2.任意产生k个聚类，然后确定聚类中心，或者直接生成k个中心。 3.对每个点确定其聚类中心点。 4
具有选定初始中心的k均值

问题内容：我正在尝试使用选定的初始质心进行k均值聚类。它说在这里指定您的初始中心：如果通过，它应该是形状（的，）并给出初始中心。我在Python中的代码：返回错误：并返回相同的初始中心。任何想法如何形成初始中心以便可以被接受吗？问题答案：的默认行为是使用不同的随机质心多次初始化算法（即Forgy方法）。然后，随机初始化的数量由参数（docs）控制： n_init ：int，默认值：
使用第1随机数随机选择初始状态X0

我有一个概率问题：在任何一天，埃里克要么是快乐的(C)，要么是马马虎虎的(S)，要么是闷闷不乐的(G)。如果他今天很高兴，那么他明天将是C、S或G，相应的概率为0.5、0.3、0.2。如果他今天感觉一般，那么他明天会是C，S或G，概率是0.3，0.4，0.3。如果他今天闷闷不乐，那么他明天会是C，S或G，概率是0.2，0.2，0.6。我在R中生成了50,000个独立的伪随机数（均匀的），
什么是K-means聚类算法

主要内容：聚类和分类的区别,找相似,簇是什么,理解K的含义,如何量化“相似”,总结机器学习算法主要分为两大类：有监督学习和无监督学习，它们在算法思想上存在本质的区别。有监督学习，主要对有标签的数据集（即有“参考答案”）去构建机器学习模型，但在实际的生产环境中，其实大量数据是处于没有被标注的状态，这时因为“贴标签”的工作需要耗费大量的人力，如果数据量巨大，或者调研难度大的话，生产出一份有标签的数据集是非常困难的。再者就算是使用人工来标注，标注的速度也会比数据生产的速度慢的多。因
MySQL：选择多个随机行的最有效方法是什么

问题内容：我有一个相当大的数据集和一个需要两个联接的查询，因此查询的效率对我来说非常重要。我需要根据联接的结果从数据库中检索3个满足条件的随机行。这里指出最明显的解决方案效率低下，因为 [这些解决方案]需要对所有表进行顺序扫描（因为需要计算与每一行关联的随机值-以便可以确定最小的行），即使对于中等大小的表也可能相当慢。但是，那里的作者建议的方法（其中num_value是ID）对我不起作用，因为

k-means除了随机选择初始质心，还有什么方法？

相关阅读

相关文章

相关问答

相关工具

相关文档