我对机器学习很陌生。对不起,如果我的英语有任何错误。 我使用weka J48分类来预测是真是假。我有将近999K的训练套件,我用来训练模型。我使用了3倍的交叉验证方法来训练模型,使我的准确率达到了约84%。 现在在存储模型之后。我试着在50k数据集上测试它。结果非常糟糕,其中50%是不匹配的。我有11个属性,包括名词和数字字段。 我不知道为什么会这样。 我有两个问题。 我怎样训练才能在测试集中表现
本章中,你会假装作为被一家地产公司刚刚雇佣的数据科学家,完整地学习一个案例项目。下面是主要步骤: 项目概述。 获取数据。 发现并可视化数据,发现规律。 为机器学习算法准备数据。 选择模型,进行训练。 微调模型。 给出解决方案。 部署、监控、维护系统。 使用真实数据 学习机器学习时,最好使用真实数据,而不是人工数据集。幸运的是,有上千个开源数据集可以进行选择,涵盖多个领域。以下是一些可以查找的数据的
随着 AlphaGo 在人机大战中一举成名,关于机器学习的研究开始广受关注,数据科学家也一跃成为 21世纪最性感的职业。关于机器学习和神经网络的广泛应用虽然兴起不久,但是对这两个密切关联的领域的研究其实已经持续了好几十年,早已形成了系统化的知识体系。对于想要踏入机器学习领域的初学者而言,理论知识的获取并非难事。
一面 约35min 自我介绍 项目内容 项目内mysql和redis的应用 BERT细节 data collator相关 八股 python 协程、线程、进程 go与python最大的不同点 mysql慢查询怎么优化 ddp有没用过 反问: 技术栈(C++和python)、为算法部门服务、资源管理(k8s,docker) 一周内知道结果 二面: 约35min 自我介绍 项目内容 流程介绍、数据集、
补录批了,还是比较简单的 面试内容: * 自我介绍 * 挑一个困难的项目介绍 * 武汉和深圳如何考虑 * 职业规划 * 期望薪资 * 三方还在吗 * 为啥还没签三方?是0offer吗
面试时长:40min 面试内容: * 自我介绍 * 简历挨着介绍 * modelart * 推理框架 * 精度影响因素 * 算子开发流程 * 手撕:阻塞队列
30分钟 自我介绍 项目拷打 Kmeans与Kmeans++的区别 Kmeans一定会收敛吗(EM算法来证明) LightGBM比XGBoost的最大提升在于直方图加速,请详细介绍一下原理和过程 为什么sigmoid、tanh和relu能被用作激活函数 神经网络梯度爆炸问题怎么解决 无手撕题
选择题内容:概率论 全是概率论(考研是吧?) 跟机器学习相关题目就一题,考recall和精确度关系; 填空题:找规律 脑筋急转弯 什么数组[i]值为不为数组中不为i的元素个数; 编程题:没写。润
#24届软开秋招面试经验大赏# 认准拉普拉斯,秋招必上岸 就业咨xun可私。 荣耀的面试体验真的很不错,面试官都是用“您”提问。而且面试过程也挺像唠嗑,还是很舒服的。 之前听说荣耀要变成国企,还有说要单独上市的,也不知道谁说得对。 整体来看,面试难度不高,而且今年好像给的很大方。 面了半小时,难度两颗星。 1 自我介绍 2 实习介绍 项目介绍 科研介绍 3 讲一下科研,挺感兴趣这个东西 4 说一下
#24届软开秋招面试经验大赏# 认准拉普拉斯,秋招必上岸 就业zixun可私。 荣耀一共就两轮面试,而且也没考coding。每轮都是半小时左右。去面试间等着叫号,还是体验挺好的。 出结果也挺快的,不像华子那么能泡。 二面应该是主管面了。 面试时间半小时,难度一颗星。 1 自我介绍 2 实习介绍 项目介绍 科研介绍 3 平时喜欢看哪方面的论文,分享一个。 4 看我实习挺多,方向是怎么选的,有没有什么
#快手# #暑期实习# #二面# #推荐算法# #推荐算法面经# 时间2024年4月3日 15:00 总计65min 1.自我介绍 2.本科推荐系统项目(参考一面面经) 3.论文 4. 讲一讲CTR预估和序列推荐模型 - DIN DIEN SIM Caser GRU4Rec SLiRec CLSR MIND.... 5. 了解矩阵分解吗 - MF、LFM 6.LSTM模型介绍,几个门的作用 7.t
一面 3.21 问项目:问了一个项目,问的非常详细,大概问了30min 然后问基础: transformer的架构 为什么使用multi-head、残差链接和前馈神经网络层 梯度消失的原因是什么 gpt和t5的区别 bert和t5的区别 了解现有的大模型,比如LLaMa这些吗 代码:删除链表倒数第k个节点,需要考虑到k>链表长度这个边界情形
1. 手撕,给出中序遍历和后序遍历,构建树 2. 介绍树模型,(GBDT,XGBoost等) 3. 项目为什么用XGBoost 4. 介绍LR 6. XGB和LR的区别,各适用哪些场景。 7. 项目中Lovain算法是个什么算法。 8. 项目中使用的评价指标 9. 准确率有什么缺点和问题 10. AUC 11. 优化算法 12. 激活函数 13. 特征提取方法? 14. CNN和MLP区别,CNN
背景:211本硕,一作SCI一区论文两篇,无实习。 9.14(一面) 面试官没露脸,听声音是女生,上来先让做个自我介绍。 然后说:“说下你的论文吧。欸?你没准备PPT吗?” 我内心:??????且不说邮件里没这要求,就算有,你前一天晚上才给我发的面试通知我上哪给你弄PPT去? 然后还是耐心和她说:”我对着论文讲可以嘛?” 她无语地说:“行吧。” 然后就是漫长地边讲边解释的过程,她似乎是对我的方向基
10点到3点半,中间停了一个半小时,面完人都傻了,真遭不住...... 一面 基本就围绕实验室项目聊了好久,中间穿插问了几个强化学习算法原理 然后问了深度学习和pytorch 几个简单的点 手撕:一个数组,对每个数可以给+ 或者-号,问有多少种情况可以和为target 二面 基本也是就围绕实验室项目聊了好久 然后再聊了好久Tcmalloc 手撕:一个无序数组,然后把它变成a <= b >= c <