我对机器学习很陌生。对不起,如果我的英语有任何错误。 我使用weka J48分类来预测是真是假。我有将近999K的训练套件,我用来训练模型。我使用了3倍的交叉验证方法来训练模型,使我的准确率达到了约84%。 现在在存储模型之后。我试着在50k数据集上测试它。结果非常糟糕,其中50%是不匹配的。我有11个属性,包括名词和数字字段。 我不知道为什么会这样。 我有两个问题。 我怎样训练才能在测试集中表现
7.14 一面 一面全部是写代码,连自我介绍都没有😂 - 快速幂(easy)扩展问题:python如何处理数据溢出? - 用pytorch实现单头self-attention(mid+),之后问了self-attention的细节和一些扩展理解 - 一个数组,如果前面的数大于后面的数的二倍,则记作一个翻转对,求翻转对的个数(hard)其实是逆序对的变种,实现归并之后稍微改改就行 7.20 二面
本章中,你会假装作为被一家地产公司刚刚雇佣的数据科学家,完整地学习一个案例项目。下面是主要步骤: 项目概述。 获取数据。 发现并可视化数据,发现规律。 为机器学习算法准备数据。 选择模型,进行训练。 微调模型。 给出解决方案。 部署、监控、维护系统。 使用真实数据 学习机器学习时,最好使用真实数据,而不是人工数据集。幸运的是,有上千个开源数据集可以进行选择,涵盖多个领域。以下是一些可以查找的数据的
随着 AlphaGo 在人机大战中一举成名,关于机器学习的研究开始广受关注,数据科学家也一跃成为 21世纪最性感的职业。关于机器学习和神经网络的广泛应用虽然兴起不久,但是对这两个密切关联的领域的研究其实已经持续了好几十年,早已形成了系统化的知识体系。对于想要踏入机器学习领域的初学者而言,理论知识的获取并非难事。
30分钟 自我介绍 项目拷打 Kmeans与Kmeans++的区别 Kmeans一定会收敛吗(EM算法来证明) LightGBM比XGBoost的最大提升在于直方图加速,请详细介绍一下原理和过程 为什么sigmoid、tanh和relu能被用作激活函数 神经网络梯度爆炸问题怎么解决 无手撕题
#24届软开秋招面试经验大赏# 认准拉普拉斯,秋招必上岸 就业咨xun可私。 荣耀的面试体验真的很不错,面试官都是用“您”提问。而且面试过程也挺像唠嗑,还是很舒服的。 之前听说荣耀要变成国企,还有说要单独上市的,也不知道谁说得对。 整体来看,面试难度不高,而且今年好像给的很大方。 面了半小时,难度两颗星。 1 自我介绍 2 实习介绍 项目介绍 科研介绍 3 讲一下科研,挺感兴趣这个东西 4 说一下
#24届软开秋招面试经验大赏# 认准拉普拉斯,秋招必上岸 就业zixun可私。 荣耀一共就两轮面试,而且也没考coding。每轮都是半小时左右。去面试间等着叫号,还是体验挺好的。 出结果也挺快的,不像华子那么能泡。 二面应该是主管面了。 面试时间半小时,难度一颗星。 1 自我介绍 2 实习介绍 项目介绍 科研介绍 3 平时喜欢看哪方面的论文,分享一个。 4 看我实习挺多,方向是怎么选的,有没有什么
#快手# #暑期实习# #二面# #推荐算法# #推荐算法面经# 时间2024年4月3日 15:00 总计65min 1.自我介绍 2.本科推荐系统项目(参考一面面经) 3.论文 4. 讲一讲CTR预估和序列推荐模型 - DIN DIEN SIM Caser GRU4Rec SLiRec CLSR MIND.... 5. 了解矩阵分解吗 - MF、LFM 6.LSTM模型介绍,几个门的作用 7.t
一面 3.21 问项目:问了一个项目,问的非常详细,大概问了30min 然后问基础: transformer的架构 为什么使用multi-head、残差链接和前馈神经网络层 梯度消失的原因是什么 gpt和t5的区别 bert和t5的区别 了解现有的大模型,比如LLaMa这些吗 代码:删除链表倒数第k个节点,需要考虑到k>链表长度这个边界情形
选择题内容:概率论 全是概率论(考研是吧?) 跟机器学习相关题目就一题,考recall和精确度关系; 填空题:找规律 脑筋急转弯 什么数组[i]值为不为数组中不为i的元素个数; 编程题:没写。润
10点到3点半,中间停了一个半小时,面完人都傻了,真遭不住...... 一面 基本就围绕实验室项目聊了好久,中间穿插问了几个强化学习算法原理 然后问了深度学习和pytorch 几个简单的点 手撕:一个数组,对每个数可以给+ 或者-号,问有多少种情况可以和为target 二面 基本也是就围绕实验室项目聊了好久 然后再聊了好久Tcmalloc 手撕:一个无序数组,然后把它变成a <= b >= c <
1. 手撕,给出中序遍历和后序遍历,构建树 2. 介绍树模型,(GBDT,XGBoost等) 3. 项目为什么用XGBoost 4. 介绍LR 6. XGB和LR的区别,各适用哪些场景。 7. 项目中Lovain算法是个什么算法。 8. 项目中使用的评价指标 9. 准确率有什么缺点和问题 10. AUC 11. 优化算法 12. 激活函数 13. 特征提取方法? 14. CNN和MLP区别,CNN
一面 约35min 自我介绍 项目内容 项目内mysql和redis的应用 BERT细节 data collator相关 八股 python 协程、线程、进程 go与python最大的不同点 mysql慢查询怎么优化 ddp有没用过 反问: 技术栈(C++和python)、为算法部门服务、资源管理(k8s,docker) 一周内知道结果 二面: 约35min 自我介绍 项目内容 流程介绍、数据集、
补录批了,还是比较简单的 面试内容: * 自我介绍 * 挑一个困难的项目介绍 * 武汉和深圳如何考虑 * 职业规划 * 期望薪资 * 三方还在吗 * 为啥还没签三方?是0offer吗
面试时长:40min 面试内容: * 自我介绍 * 简历挨着介绍 * modelart * 推理框架 * 精度影响因素 * 算子开发流程 * 手撕:阻塞队列