主成分分析是一种降维方法,通过将一个大的特征集转换成一个较小的特征集,这个特征集仍然包含了原始数据中的大部分信息,从而降低了原始数据的维数。换句话说就是减少数据集的特征数量,同时尽可能地保留信息。降维是将训练数据中的样本(实例)从高维空间转换到低维空间,该过程与信息论中有损压缩概念密切相关。同时要明白的,不存在完全无损的降维。
机器学习即Machine Learning,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。目的是让计算机模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断完善自身的性能。简单来讲,机器学习就是人们通过提供大量的相关数据来训练机器。
【写面筋积累好运】 半小时的第一次面试,也是时隔1个月来的面试,希望不是kpi吧。 #网易信息集散地# #23届找工作求助阵地# 项目没有怎么问,基本上是问的项目里面的八股文。 手写某某网络传播公式。 手写xgb的计算公式。 解释用到的网络结构。 问dataset和dataloader的区别。 问python的迭代器什么的(不会) 手撕了一个回溯算法的题,写出来了,但是面试官说没有看到输出,慌得一
欧氏距离 也称欧几里得距离,是指在m维空间中两个点之间的真实距离。欧式距离在ML中使用的范围比较广,也比较通用,就比如说利用k-Means对二维平面内的数据点进行聚类,对魔都房价的聚类分析(price/m^2 与平均房价)等。 两个n维向量a($$x_{11},x_{12}.....x_{1n}$$)与 b($$x_{21},x_{22}.....x_{2n}$$)间的欧氏距离 python 实现
主要作者:@徐英凯|闪银机器学习工程师 审校顾问:@卢誉声|Autodesk 软件研发工程师、@高扬|欢聚时代资深大数据技术专家、@罗远飞|第四范式机器学习工程师 Toolbox C/C++ Vowpal Wabbit MultiBoost Shogun Java Mahout Weka Mallet JSAT Python Scikit-learn PyBrain nltk Theano Pyl
美团笔试4道a了3,面完挂了一次被捞起来,然后面了两轮因为不太匹配又被丢回人才库了,今天又通知被捞了起来…… 记录一下前两轮面试吧,希望这次被捞能有好结果 优选一面(1h 凉) 一直问项目,目标检测的,数据集、模型…… 问图生图的,评价指标,模型结构 以上问了四十多分钟 写题:LeetCode 152. 乘积最大子数组 题不难,脑抽了,初始化一直有问题(你这个方法应该没啥问题,过不了的话你回去再调
自我介绍 介绍项目 介绍实习,面试官问的内容和ML的关系不太大,可能是和部门的工作比较契合所以就没为难我。 面试官向我介绍部门的工作内容,了解到和我目前实习工作相关性较强。 手撕:比较版本号 反问,因为投的是深圳+北京,所以问了一下base地。
冬招的第一个offer 一面 先拷打项目 然后手撕多头注意力机制和一道算法题:lcr08长度最小子数组 然后问了一些八股 linux如何查看某个文件有多少行 linux如何查看某个文件的第几列 git回滚的指令 合并分支的指令 弹一弹熟悉的激活函数和优缺点 fasterrcnn的优化 yolov5v8的优化 为什么业内yolov5用的比较多而不是yolov8 多头注意力机制和单头相比有什么优势 正
什么是机器学习? 机器学习是自动从数据中提取知识的过程,通常是为了预测新的,看不见的数据。一个典型的例子是垃圾邮件过滤器,用户将传入的邮件标记为垃圾邮件或非垃圾邮件。然后,机器学习算法从数据“学习”预测模型,数据区分垃圾邮件和普通电子邮件。该模型可以预测新电子邮件是否是垃圾邮件。 机器学习的核心是根据数据来自动化决策的概念,无需用户指定如何做出此决策的明确规则。 对于电子邮件,用户不提供垃圾邮件的
一面 自我介绍 结合项目描述RNN、LSTM结构,描述模型改进原理 残差连接的优势 梯度消失问题——对比深度网络的梯度消失和循环网络的梯度消失 数据不平衡问题原因与解决措施 性能指标F1分数的计算方式 DDQN项目的环境介绍与网络模型 深度学习和强化学习的关联 Adam优化器的原理,SGD的原理 手撕: 最长有效的括号字符子序列(返回所有最长的子序列)(10分钟) 反问: 1分钟 emmm手撕ha
遇到了全是技术岗的群面,一起讨论怎么ai技术加入产品 总结:一定要读题!!!针对题来每点说自己的想法,最好把自我介绍压缩一下,组里好几个人没有说完就被下一个了,而且顺序不是按照公众号的个人编号。 读题5min,自我介绍➕想法1.5min,讨论20min,总结5min 就算没有抢到主持人,中途理清团队的思路也很重要!!!我的组两个技术大佬一直不统一。。。导致其他人也没有发表什么明确的想法和意见,我发
时长70分钟左右,主要在问项目,其他八股挺常规的 八股: transfromers和RNN, LSTM的区别 解释一下梯度爆炸和解决方法 BN和LN的区别 讲讲了解的激活函数 怎么识别 / 解决过拟合问题 XGBoost和随机森林的区别 算法题: 最长公共子串 面完第二天秒挂,可能是笔试做得太烂了
今天下午面了快手的机器学习,部门是做搜广推的,面试官小哥哥介绍了一下部门情况,看到我是做图像的,感觉有点不太匹配,然后问我愿不愿意面试,我当然愿意了 时长:50min 1.自我介绍2分钟 2.介绍一下自己的项目,面试小哥不太懂我的这个项目,这里讲了比较多 3.二分类问题常用的评估指标?其中提到了召回率,出了个场景题说一下怎么计算 4.AUC怎么计算? 5.AUC接近1可能的原因是什么? 6.手撕:
自我介绍,三道编程题(二叉树和图,a了两道),项目深挖
分享一下百川智能的笔试,对于校招生来说难度很大,我只做出来第二题,其余两题都没有什么思路。 笔试题 1 很久很久以前,有一个 NBA 球探,主要负责在大学联盟中,给球队寻找有潜力的年轻射手。现在他手里有非常多而且格式凌乱的新秀投篮数据,让球探不知如何选择,作为球探的助理,你需要给出一份符合要求的球员名单。要求如下: 在一个学期的大学比赛中,至少连续登场 5 次,并且每场比赛的前 5 次投篮的总分是