数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
1.1 KNN 1.1.1 思想 计算离待分类点距离最近的 K 个已分类点,K 个点中出现最多点种类为待分类点的种类。 1.1.2 距离 常见距离有欧式距离和余弦距离。余弦距离可以消除量纲的影响。相关系数 2. 聚类算法 2.1 K-means 2.1.1 思想 2.1.1.1 模型训练 根据类别个数 N,初始化 N 个点,作为该类别的中点。 遍历其他点,计算距离最近的中心点,该中心点的类别为当前
2道编程共40分,5道问答110分,共两个半小时,没做多久就退出来,哎。。。 有一道编程题用例过了,一提交通过0个用例,麻了 大佬给看看: 题目是车牌号识别准确率计算 输入N个车牌号,第一个字母是颜色,最后5个是号码,中间是地区号 每一行一个识别出的号码,一个真实标签 #我的秋招日记##网易雷火笔试##23届秋招笔面经#
群面: 1.技术类抢答: lstm三层 xgb和gbdt的区别 决策树剪枝流程 逻辑回归原理 2.智慧园区项目自由讨论: 如何选人脸识别供应商 讨论智慧园区的人脸识别风险及解决 一面(过) 笔试挂,无二面
1.自我介绍 2.深挖简历 3.询问移动实习经历 4.询问贝壳数据分析项目 面完说岗位竞争比较大,问想去市公司吗?直接拒绝
#24届软开秋招面试经验大赏# 认准拉普拉斯,秋招必上岸 就业zixun可私。 先说一下,顺丰这个测评还挺有意思,比别的家**行测和性格测试有意思多了。而且确实感觉更能测出来东西,推广! 顺丰整体面试难度低,好像工资也挺低。不知道福利待遇啥的咋样。 面了半个多小时,难度一颗星。 1 自我介绍 2 项目介绍 科研结束 实习介绍 3 讲一个做的最好的项目。背景是啥,业务是啥,咋做的,为什么这么做,为什
顺丰 2022 暑期实习 大数据挖掘与分析工程师 4.2 测评 4.21 面试 深挖简历,什么都问。 ML,主要是比较几个模型,Kmeans & DBSCAN分别应用在哪些场景比较好? LR & SVM的区别?分别应用在那些场景? DL,简单介绍一下RNN,它和LSTM,ARIMA的区别? 是否了解大数据?说说你了解的hadoop和spark。(说我这部分有待加强,现在做数据挖掘必须要会) sq
一开始我以为数据挖掘岗和数据分析比较相似,但是现在看来不是这样的。跟算法沾边比较多。 首先自我介绍,之后问我简历上的项目 之后问我有没有了解过深度学习以及有没有nlp的经验,我实事求是,之后之后就开始闲聊了 一开始没有意识到什么,就觉得聊的来的,但是最后结果就是没过。 技术只问了时序分析…
前面都是选择,一些机器学习和概统的题。 就一道编程,是剑指offer里面的滑动窗口最大值,hard。 做的时候也是用C++做的。。然后一运行发现不能运行,才看到限python语言 结果就是python不怎么熟悉,尝试了一下直接溜了 已经寄了 #美的笔试#
👥 面试题目 hadoop的三个核心组件,以及hdfs的读写原理 hive的内部表与外部表有什么区别 hive里面的数据倾斜是什么?怎么去处理?该怎么去预防? 数据仓库的分为几层?每一层是做什么的?是根据什么进行分层的? hive里面的窗口函数有没有用过?rank(),,dense_rank(),row_number()这三个有什么区别? hive里面数据表合并是怎么合并的? hive里面的列
一面 问实习 问的比较详细 然后问基础 XGBOOST算法详细介绍 XGBOOST算法与LightGBM区别 怎么筛选数据特征以及PCA怎么做 欠拟合怎么解决 注意不是过拟合 还问了一个业务问题 因为可能是美团平台事业部 写代码 leetcode 322 零钱兑换 要求同时输出零钱数量 以及 零钱组合 动态规划 粗心了 最开始只写了零钱数量 SQL 代码 比较简单 两个情形 一个题目 面试官水平挺
一面 8.29 下午16:00-17:00 1.自我介绍 2.项目介绍 3.项目细节 4.随机森林、决策树、XGBoost的区别和联系 5.离散特征怎么处理?(没听懂面试官想问啥 ) 6.针对项目提问,连续特征怎么处理? 算法:最大子序和 动态规划+贪心算法 做题有点慢 面试官建议:虽然有些东西工作不会用到,但是面试还是会问,题还是应该多刷一刷 不说了,刷题背八股去了,小姐姐很温柔,希望能再给个机
提问: 自我介绍 介绍一下你简历上的项目? 除了这个还做过其他的项目吗? 有没有参加过建模比赛? 对机器学习有了解吗? 总结: 面试官看起来是人事部门的,不像是技术人员,都没怎么问技术,很快就结束了。 心态上凑合,没上次那么紧张了。 老毛病又犯了呀我真的,跟对面那姐姐聊的太诚实了,机器学习那里我跟人说没怎么用过,回想起来就应该说一直有学习,也了解过,我真的悔死。虽然我也说了几种有监督和无监督的算法
实习生岗位,没有转正机会,本牛没有实习经历 1.自我介绍 2.介绍自己一个与数据分析相关的项目(介绍了期末project) 3.学习中掌握的数据分析技能有哪些(答了sql和python) 4.介绍一个学习中的困难以及是怎么克服的(很笼统地说了些学习中遇到的困难),面试官不满意,一定要我具体介绍某一个困境或者很suffer的经历 5.反问:该岗位还需要哪些能力,面试官答曰需要一双发现的眼睛,会探索的
区块链的许多更广为人知的用途都涉及到加密货币的使用,我(非常有限)的理解是,挖掘被用作阻止一次生成过多硬币的工作证明,而且池越大,挖掘时间越长。 我也看到很多文章谈论区块链的其他用途,如医疗保健、抵押贷款、跟踪产品等。但我不明白的是,在这些情况下如何使用挖掘?当然,如果将其用于医疗记录,那么链的大小将快速增长,患者或医生不希望在访问时等待他们的新“块”被添加到链中的时间太长。 那么,在速度很重要的