推荐算法是非常古老的,在机器学习还没有兴起的时候就有需求和应用了。概括来说,可以分为以下5种: 1)基于内容的推荐:这一类一般依赖于自然语言处理NLP的一些知识,通过挖掘文本的TF-IDF特征向量,来得到用户的偏好,进而做推荐。这类推荐算法可以找到用户独特的小众喜好,而且还有较好的解释性。这一类由于需要NLP的基础,本文就不多讲,在后面专门讲NLP的时候再讨论。 2)协调过滤推荐:本文后面要专门讲
由于本身是做cv的,没有任何推荐算法经验,因此本篇内容对于找推荐算法意义不大,纯粹记录一下 1. 自我介绍,然后介绍完面试官问我知不知道面的是推荐算法😅,不过这也是他们看的简历没挂我简历就是他们的问题😄 2.是否知道cv在推荐搜索当中的一些应用? 3.项目介绍,t2i和inpainting模型分别解决什么问题,为什么要级联 4.做的主要是微调的任务,微调过程当中有些什么trick?以及背后的原
问了几分钟论文,出了一道零钱a了 加上自我介绍二十分钟不到面完 过了一周 今天发消息说进人才库了 包kpi的😅
很快啊,前脚面试完快手,后脚京东就来了 1.code 经典dp,左上走到右下最小开销,一次成功! 2.业务 问了具体怎么做的,比如如何构建正负样本,模型预测的是什么 3.无八股 稍微问了问细节怎么实现的,也全都回答上来了,已经被挂麻了,给个机会吧
一面: 自我介绍; 面试官粗略地看了一下项目说:“你这个简历好像更适合NLP组啊,跟我们组的业务好像关系不是很大,感觉不是很合适啊。” 一阵简短的沉默; 我:“。。。。。。我也投了NLP算法组,但是被推荐算法组先捞上来了,您看要不跟HR反馈一下让她把简历转过去?“ 面试官:”那倒不用,我们先面着吧。” 面试问题分界线 ----------------------------------------
乱序 1、有了解fm吗。不太熟悉,核心思想是将wij分解为vil和vlj。 2、transformer的注意力机制。x复制3份,交由三个权重矩阵得到qkv,softmax(qk^T)/(根号dk)*v。之后就是一些具体在干嘛的,我说的用这个做的机器翻译,当时是纯手打完transformer成所以比较熟悉,记忆比较深刻,但是面试官好像没继续深入问下去。 3、说一下mmoe。这是一个多任务的双塔模型,
自我介绍 介绍项目 BERT了解吗,具体讲一下 BERT采用哪种noramlization方式 transfomer为什么要除以dk 推荐算法了解多少,具体讲一下推荐算法框架及流程 手撕代码 查找最小k个数 你有什么要问我的吗
来还愿了,希望友友都能拿到自己想要的offer 一面 1.自我介绍 2.代码:top K 3.代码:给一个链表,只反转从left到right内的元素,其余不变 4.问实习项目,没有挖的很深。 5.讲一讲序列建模的模型 6.为什么self-attention可以堆叠多层,有什么作用 7.多头有什么作用?如果想让不同头之间有交互,可以怎么做 8.讲一讲多目标优化,MMoE怎么设计?如果权重为1,0,0
推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。 随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用户很难从如此多的信息流中找到对自己有价值的信息。 解决信息过载有几种手段:一种是搜索,当用户有了明确的信息需求意图后,将意图转换为几个简短的词或者短语的组合(即q
自我介绍 简单介绍一下这个推荐项目 用户数据量和内容数据量,总共有多少特征,具体是大概有哪些特征,用户行为序列用到了吗? 一个特征有多个值的情况是怎么处理的? 有做特征选择吗?训练数据量多大?多路召回怎么做的?多路召回有几路?多路召回是怎么融合的? 有做粗排吗? 召回的离线指标和线上指标大概是什么情况? 用户的冷启动是怎么做的? 介绍一下 GrapSAGE,word2vec, deepwalk,
一面 一小时 介绍自己的项目 项目相关问题(其中一个是问方法/论文的创新点在哪) 协方差和相关系数是什么,他们的的关系是什么 L1范数和L2范数的区别 谈谈Sigmoid ReLU函数在0点的梯度怎么处理 Transformer和Rnn的区别 谈谈Transformer多头注意力机制,多头注意力和普通注意力的区别 从普通注意力换成多头注意力会导致参数暴涨吗?如果有所增加的话,请分析主要是哪个结构导
共计35min 1、自我介绍 2、介绍一下实习? 大模型微调的样本量大概是多少? 详细介绍推荐算法实习的背景和思路? 3、学习经历 本科学过什么课?编程相关的?运筹优化相关的?实验室研究方向是啥? 4、八股 大模型和推荐结合的地方有什么?想做大模型还是推荐? 对推荐系统的哪些地方感兴趣?了不了解召回?有哪些算法?了不了解排序?有哪些算法?介绍一下SENET?用户冷启动怎么做? 推荐系统物品点击率的
自我介绍 对推荐算法了解如何 项目深挖 两个项目都是kaggle上的,面试官还吐槽怎么全是kaggle(这不是非科班没有项目只能硬整两个么) 打比赛模型大家都差不多,如何进行提升 介绍一下transfermer 手写一下transfermer的自注意力的公式 求数组中第k大的数(写了个nlogn的归并,经面试官提醒发现可以用快排写o(n),但是快排忘了) 反问 面试了一个小时,体验还行,面试官看我
一面: 1. 对推荐算法大概有多少了解 2. kaggle比赛用了什么模型,做了什么优化 3. 你是如何把几个模型的分数做融合的 4. 如果这个权重也作为一个变量参与到训练,这种方式和你手动调参相比会有什么样的差异呢 这题我回答的是串行训练会更多耗时,但是参数精度会提高效果会更好,但是总觉得还是没答到点子上 5. 随机森林的具体运行过程 6. 如何判断过拟合和欠拟合,怎么解决 7. 如何解决梯度消
一面时间:4月7日 11:00 ~ 12:00 没有开摄像头,先是自我介绍 然后详细的问了一下实习经历,对实习中的项目做了非常详细的询问。 期间问了一下auc和gauc的区别,为什么使用gauc而不用auc。 然后因为项目用了图文理解大模型,询问了一些对比学习的loss,介绍一些nce loss之类的,然后怎么构造正负样本。 还有就是交叉熵损失函数的使用的注意事项。 使用RELU的一些潜在问题。