当前位置: 首页 > 软件库 > 大数据 > 其他 >

DataHref

数据挖掘算法及工具教程
授权协议 GPL
地区 国产
投 递 者 吴炎彬
软件类型 开源软件
开源组织
适用人群 未知
操作系统 跨平台
所属分类 大数据、 其他
 软件概览

mllib、scikit 等数据挖掘工具的教程。

随着大数据技术的普及,对数据挖掘的需求在不断上升,本项目为一些常用的数据挖掘工具提供中文文档,并提供一部分数据挖掘算法的教程,仍在不断更新中。

数据挖掘算法教程

scikit使用教程

scikit数据集简介

 相关资料
  • 数据挖掘 18 大算法实现以及其他相关经典 DM 算法,BIRCH 算法本身上属于一种聚类算法,不过他克服了一些 K-Means 算法的缺点。

  • 数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

  • 1.1 KNN 1.1.1 思想 计算离待分类点距离最近的 K 个已分类点,K 个点中出现最多点种类为待分类点的种类。 1.1.2 距离 常见距离有欧式距离和余弦距离。余弦距离可以消除量纲的影响。相关系数 2. 聚类算法 2.1 K-means 2.1.1 思想 2.1.1.1 模型训练 根据类别个数 N,初始化 N 个点,作为该类别的中点。 遍历其他点,计算距离最近的中心点,该中心点的类别为当前

  • 到这里为止,所有流程都走完了。 9月8日 一面,当天出结果 9月12日 二面,当天出结果 9月14日 三面,次日出结果 9月19日 hr面 1. hr上来先介绍了一下这个岗位未来具体做的事情,介绍的很详细。 2. 让我自己讲讲对这个岗位的理解 3. 自我介绍 4. 聊天 ①职业规划 ②你说你是美团的忠实用户,你可以聊聊你自己对美团的印象吗 (本人是究极吃货+旅游爱好者,出去旅游几乎全靠美团订酒店+

  • 9月8日 一面,当天出结果 9月12日 二面,当天出结果 1. 自我介绍 2. 项目介绍,围绕项目出发询问一些相关的问题。这个过程在15分钟左右。 3. :你前面写题了吗 我:一面写了,二面没写 4. 在我以为要出题的时候,没有了……进入反问环节 我:啊!怎么这么快 :因为我们这个三轮的技术面是一个综合的评估,有些问题前两面面过了,就没必要再问了 后续流程:说本次面试的结果很快就会出。还剩最后一轮

  • 9月8日 一面,当天出结果 9月12日 二面 1. 自我介绍 2. 项目介绍,围绕项目出发询问一些相关的问题,一定量的八股,还有这个模型为什么不能用在这方面,以及有什么优化方案之类的想法 3. 学校问题 :我看你这个是两年制的啊 答:其实是三年制的,一般是第一二年上课,第三年做论文。我第一年就把课全上完了所以可以直接进入论文阶段了 :哦?那你这样时间不会很赶吗 答:对比三年的同学可能是有点吧,但我

  • 说在前面:感谢团子面试官帮我缓解了面试焦虑症。团子面试官人很好,很亲切,还让我不要紧张谢谢团子,可惜人太菜了 8月7日 笔试 4道a了3道 8月22日 收到了 (一志愿)到店-自然语言处理算法工程师 的面试邀请,无奈当时那周实在是太太太忙了,又要搬家又要坐高铁,实在是抽不出时间。于是反馈希望可以安排到下一周,结果上官网一看流程,直接挂了 9月5日 接到 (二志愿)机器学习/数据挖掘算法工程师 电话

  • 一位挖掘专家 tom khabaza 提出了挖掘九律,挺好的东西,特别是九这个数字,深得中华文化精髓,有点独孤九剑的意思: 第一,目标律。 数据挖掘是一个业务过程,必须得有业务目标。无目的,无过程。 第二,知识律。 业务知识贯穿在挖掘这个业务过程的各环节。 第三,准备律。 数据获取、数据准备等数据处理耗时占整个挖掘过程的一半。 第四,NFL律。 NFL,没有免费的午餐。没有一个固定的算法适用所有的