推荐算法是非常古老的,在机器学习还没有兴起的时候就有需求和应用了。概括来说,可以分为以下5种: 1)基于内容的推荐:这一类一般依赖于自然语言处理NLP的一些知识,通过挖掘文本的TF-IDF特征向量,来得到用户的偏好,进而做推荐。这类推荐算法可以找到用户独特的小众喜好,而且还有较好的解释性。这一类由于需要NLP的基础,本文就不多讲,在后面专门讲NLP的时候再讨论。 2)协调过滤推荐:本文后面要专门讲
听说写面经可以多拿offer 小红书一共是三轮技术面+HRBP面,整个面试体验很好,官网投完简历两天就面试了,结果出的也很快,几轮的面试官人都很nice。 一面,一小时左右: 首先是做自我介绍,这个可以提前准备一下 介绍简历中写的论文,讲的过程中面试官会提一些问题,问的蛮中肯的,也提了一些建议,沟通很愉快。会问下做的东西在工业界有没有一些应用场景,可以发散的聊一聊 问了下之前在美团实习主要是做些什
推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。 随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用户很难从如此多的信息流中找到对自己有价值的信息。 解决信息过载有几种手段:一种是搜索,当用户有了明确的信息需求意图后,将意图转换为几个简短的词或者短语的组合(即q
自我介绍 简单介绍一下这个推荐项目 用户数据量和内容数据量,总共有多少特征,具体是大概有哪些特征,用户行为序列用到了吗? 一个特征有多个值的情况是怎么处理的? 有做特征选择吗?训练数据量多大?多路召回怎么做的?多路召回有几路?多路召回是怎么融合的? 有做粗排吗? 召回的离线指标和线上指标大概是什么情况? 用户的冷启动是怎么做的? 介绍一下 GrapSAGE,word2vec, deepwalk,
一面 八股拷打,不再赘述:过拟合,transformer等 手撕(web IDE) 对称的二叉树 lc原题 二面 1. 如果现在数据量特别大,并发量特别高,你有什么好的办法能够提高用户的体验 2. 如果现在有一些数据给到你让你去拿给标注人员标注,你怎么样发挥他的最大价值 3. 熵的计算公式 手撕(web IDE) 1. 不同路径 lc原题 2. 给一堆树的高度,问砍的次数,二分答案 HR面 聊天
#美团暑期##推荐算法面经# 第一次笔试(机试)213/500 第二次笔试(机试)390/500 100+100+100+80+10 # 一面 -时间:2024年3月26日 11:00,总计58分钟 -自我介绍 -论文 -本科推荐系统项目 -职责 -开发人数 -召回用了什么算法 -个性化和非个性化 -召回怎么做融合的 -排序用了什么算法 -介绍DeepFM的FM侧怎么做的特征交叉 -图片的推荐需要
这篇文章本来是要写推荐系统从0-1该如何做,但是发现牛客网上大家更关心的是面试的经验。所以这篇文章就写我做面试官的经验吧。 自我介绍篇(前面一篇文章,已经自我介绍过了,再啰嗦一下): 我09年在上交读的计算机方向,13年毕业,大四的时候花了4个月时间复习考研,跨考了本校的应用经济学方向,然后又读了3年,16年毕业。 之所以读经济学,是因为那时候听说搞金融的钱多;结果15年股市泡沫破了之后,就没打算
9月,一面即挂,女面试官 主要围绕实习和论文, ndcg指标, mrr指标 adam优化器 deepfm 较wide& Deep 的升级,问除了lr替换成fm还有什么 mmoe、essm、ple、star 吟唱 谈谈attention dssm缺点以及解决方案 bagging , boosting 手撕1:两个字符串的最长公共子序列, 秒 手撕2:返回 array1和array2 中两个长度相同的
1.hr问题 问了最大的挑战,喜欢什么样的leader,觉得国外和国内上学的区别,性格怎么样,周围人怎么评价你,有没有女朋友,女朋友怎么评价你,反正问了一堆性格,以及什么时候可以来 2.反问 组里氛围,转正策略,公司福利 第一次全部面完,开泡! hr说四月上统一发offer
自我介绍 对推荐系统的了解:背景,前景,架构,方法 项目拷打:特征构建,模型选择,评价指标 论文拷打:背景,模型,评价指标 八股(都是从项目和论文中找的点):SVM原理及其推导,LR原理及其推导,XGBoost原理及其推导,XGBoost处理缺失值的方法,模型过拟合的处理方法, 手写:数组中前k个最小的数(类快排)
一面: 实习经历,项目经历 感觉科研经历比较多,介意做业务吗 算法:合并两个有序数组 二面: 实习经历,项目经历 推荐常用的多目标模型 AUC如何计算,推荐模型的评价指标有哪些 场景设计:瑞幸咖啡原价20元一杯,成本5元,设置动态定价的策略和算法,使利润最大(考虑用户接受度,季节偏差,是否举办活动) 算法题:AUC计算
自我介绍 实习经历详细介绍,讲了快30分钟 算法题:字符子串最大不重复字母数之和,手撕MLP 问了对于推荐算法的了解,我一无所知
本文向大家介绍PHP面试常用算法(推荐),包括了PHP面试常用算法(推荐)的使用技巧和注意事项,需要的朋友参考一下 一、冒泡排序 基本思想: 对需要排序的数组从后往前(逆序)进行多遍的扫描,当发现相邻的两个数值的次序与排序要求的规则不一致时,就将这两个数值进行交换。这样比较小(大)的数值就将逐渐从后面向前面移动。 //冒泡排序 二、快速排序 基本思想: 在数组中挑出一个元素(多为第一个)作为标尺,
在Spark MLlib中,推荐算法这块只实现了基于矩阵分解的协同过滤推荐算法。而基于的算法是FunkSVD算法,即将m个用户和n个物品对应的评分矩阵M分解为两个低维的矩阵:$$M_{m times n}=P_{m times k}^TQ_{k times n}$$ 其中k为分解成低维的维数,一般远比m和n小。如果大家对FunkSVD算法不熟悉,可以复习对应的原理篇。 2. Spark推荐算法类库
SimRank是基于图论的,如果用于推荐算法,则它假设用户和物品在空间中形成了一张图。而这张图是一个二部图。所谓二部图就是图中的节点可以分成两个子集,而图中任意一条边的两个端点分别来源于这两个子集。一个二部图的例子如下图。从图中也可以看出,二部图的子集内部没有边连接。对于我们的推荐算法中的SimRank,则二部图中的两个子集可以是用户子集和物品子集。而用户和物品之间的一些评分数据则构成了我们的二部