1.矩阵分解用于推荐算法要解决的问题 在推荐系统中,我们常常遇到的问题是这样的,我们有很多用户和物品,也有少部分用户对少部分物品的评分,我们希望预测目标用户对其他未评分物品的评分,进而将评分高的物品推荐给目标用户。比如下面的用户物品评分表: 用户物品 物品1 物品2 物品3 物品4 物品5 物品6 物品7 用户1 3 5 1 用户2 2 4 用户3 4 用户4 2 1 用户5 1 4
一面: 1. 对推荐算法大概有多少了解 2. kaggle比赛用了什么模型,做了什么优化 3. 你是如何把几个模型的分数做融合的 4. 如果这个权重也作为一个变量参与到训练,这种方式和你手动调参相比会有什么样的差异呢 这题我回答的是串行训练会更多耗时,但是参数精度会提高效果会更好,但是总觉得还是没答到点子上 5. 随机森林的具体运行过程 6. 如何判断过拟合和欠拟合,怎么解决 7. 如何解决梯度消
好像是首页自然推荐,流程推进很快,但是面试体验一般,前两面面试官都是在工位上比较吵 一面 聊半小时实习项目,问了比较多细节,但是没抛出啥记忆深刻的问题,全忘了 手撕:一个list里面存放每根木棍长度,问是否能够正好利用所有木棍拼成正n边形。应该是回溯+剪枝,一开始完全没思路,提示回溯之后写了个没咋剪枝的版本,优化预剪枝版本有点写不出来了。。不过第二天一早就通知过了 二面 聊了四十分钟实习项目,没答
一面时间:4月7日 11:00 ~ 12:00 没有开摄像头,先是自我介绍 然后详细的问了一下实习经历,对实习中的项目做了非常详细的询问。 期间问了一下auc和gauc的区别,为什么使用gauc而不用auc。 然后因为项目用了图文理解大模型,询问了一些对比学习的loss,介绍一些nce loss之类的,然后怎么构造正负样本。 还有就是交叉熵损失函数的使用的注意事项。 使用RELU的一些潜在问题。
讲一下看过的强化和推荐结合的论文 你简历提到的这些经典推荐算法的公共特性是什么? 离线的模型实际上线 给用户提供一些bad case,影响用户体验怎么办 留存率和模型实际优化的链路特别长,那该怎么办 点击率和留存率不同指标如何统一考虑? mmoe如何同时考虑这两个指标? 了解hadoop spark吗? 算法题:二分查找到AABBCDDFF奇数字符串中的单个字符C 二面感觉问的方向偏重余业务,实际
面完一小时内流程结束,挂
1.项目 问了问项目 2.八股 无 3.code 一个list,只有一个数字出现过一次,剩下都是2次,并且出现2次的数字相邻,问单次出现的数字的idx是多少,有没有比O(N)更快的算法 提醒下写出了个二分的解法,边界有点多,磕磕绊绊写完了,写了30分钟 写太慢了,感觉要挂了!
美团到店 时长1h,基本没啥八股,项目细节问的很细 1、自我介绍 2、问项目,一直聆听我在介绍项目,中间会穿插一些比较简单的问题,对embedding方式,embedding好处问了一些 3、你的优势是什么 4算法题,合并两个有序数组,要求无额外空间,on复杂度,秒了 5、面试情况 5、反问
一面 1.自我介绍 2.介绍卷积 激活 池化 全连接层含义 3.什么情况下可以不使用池化层 4.项目中使用了什么数据增强技术 5.阐述SVM原理 6.解决过拟合的方法 7.决策树怎么划分特征 8.随机森林有两种随机方式 怎么体现 9.线性模型和非线性模型的优缺点 10.样本数量小且特征数量多时 使用线性还是非线性模型 11.离散特征的处理方式 12.会不会用Linux 13.会不会TensorFl
自我介绍 项目经历 之前项目中使用过hive,spark处理数据吗 auc的定义,如何计算 xgb,lightgbm原理,模型的搭建过程,区别等 正负样本不平衡怎么解决(损失函数,降采样,过采样,模型融合等) 模型过拟合原因,该怎么解决(样本纬度,特征维度,模型维度都回答了一遍) 如何进行特征筛选 了解推荐算法吗 推荐系统构建的整体流程(召回,粗排,精排,重排,每一部分进行了简单介绍) dcn,d
秋招第一面汗流浃背
昨天傍晚约的今早面试,有点猝不及防 早起下大雨,冒着雨到实验室面试,裤腿和鞋是刚淋湿的,衣服和那啥是没晒干的 耳机还坏了,临时接了个连蓝牙连了好久 面试官来迟了三四分钟,我以为是不要我了,紧张的要死,刚开始说话都有点抖 全程没问推荐系统,感觉有点凉 许愿团子oc,饿了么已经卸载了,点外卖只用美团(oc了我直接吃一周美团)
1. 自我介绍 2. 写一个算法 Q:给一个有序数组arr[ ],和一个 int target,找到target的左索引和右索引。 例:arr = [1,1,1,1,2,2,2,3,3,3,3,3,5,5,5], target = 3. return left = 7, right = 11; 3. 问简历 3.1 介绍了电影推荐的项目。问了几个模型。 3.2 介绍了强化学习的论文,问了DQN和x
我将本章学到的内容都汇集成了一个Python类,虽然代码有些长,我还是贴在了这里: import codecs from math import sqrt users = {"Angelica": {"Blues Traveler": 3.5, "Broken Bells": 2.0, "Norah Jones": 4.5, "Phoenix": 5.0