mllib、scikit 等数据挖掘工具的教程。
随着大数据技术的普及,对数据挖掘的需求在不断上升,本项目为一些常用的数据挖掘工具提供中文文档,并提供一部分数据挖掘算法的教程,仍在不断更新中。
数据挖掘 18 大算法实现以及其他相关经典 DM 算法,BIRCH 算法本身上属于一种聚类算法,不过他克服了一些 K-Means 算法的缺点。
数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
1.1 KNN 1.1.1 思想 计算离待分类点距离最近的 K 个已分类点,K 个点中出现最多点种类为待分类点的种类。 1.1.2 距离 常见距离有欧式距离和余弦距离。余弦距离可以消除量纲的影响。相关系数 2. 聚类算法 2.1 K-means 2.1.1 思想 2.1.1.1 模型训练 根据类别个数 N,初始化 N 个点,作为该类别的中点。 遍历其他点,计算距离最近的中心点,该中心点的类别为当前
一面两个面试官。给我一种很焦急的感觉。面试时长35分钟。 CNN和MLP的区别。 什么是卷积 梯度下降的公式 lambda写个字典排序 写了一道sql,包括求和、排序 其他忘记了。 项目没咋问,因为报的岗位和这个不相关。
到这里为止,所有流程都走完了。 9月8日 一面,当天出结果 9月12日 二面,当天出结果 9月14日 三面,次日出结果 9月19日 hr面 1. hr上来先介绍了一下这个岗位未来具体做的事情,介绍的很详细。 2. 让我自己讲讲对这个岗位的理解 3. 自我介绍 4. 聊天 ①职业规划 ②你说你是美团的忠实用户,你可以聊聊你自己对美团的印象吗 (本人是究极吃货+旅游爱好者,出去旅游几乎全靠美团订酒店+
9月8日 一面,当天出结果 9月12日 二面,当天出结果 1. 自我介绍 2. 项目介绍,围绕项目出发询问一些相关的问题。这个过程在15分钟左右。 3. :你前面写题了吗 我:一面写了,二面没写 4. 在我以为要出题的时候,没有了……进入反问环节 我:啊!怎么这么快 :因为我们这个三轮的技术面是一个综合的评估,有些问题前两面面过了,就没必要再问了 后续流程:说本次面试的结果很快就会出。还剩最后一轮
9月8日 一面,当天出结果 9月12日 二面 1. 自我介绍 2. 项目介绍,围绕项目出发询问一些相关的问题,一定量的八股,还有这个模型为什么不能用在这方面,以及有什么优化方案之类的想法 3. 学校问题 :我看你这个是两年制的啊 答:其实是三年制的,一般是第一二年上课,第三年做论文。我第一年就把课全上完了所以可以直接进入论文阶段了 :哦?那你这样时间不会很赶吗 答:对比三年的同学可能是有点吧,但我
说在前面:感谢团子面试官帮我缓解了面试焦虑症。团子面试官人很好,很亲切,还让我不要紧张谢谢团子,可惜人太菜了 8月7日 笔试 4道a了3道 8月22日 收到了 (一志愿)到店-自然语言处理算法工程师 的面试邀请,无奈当时那周实在是太太太忙了,又要搬家又要坐高铁,实在是抽不出时间。于是反馈希望可以安排到下一周,结果上官网一看流程,直接挂了 9月5日 接到 (二志愿)机器学习/数据挖掘算法工程师 电话