当前位置: 首页 > 工具软件 > Sparrow > 使用案例 >

Sparrow项目疑问解答

葛胡媚
2023-12-01

1.召回层怎么处理,排序层用到了哪些深度学习模型?
召回层可以有单策略召回,比如用户对电影A评分超过4分,就将与A电影风格相同且评分在前50以内的电影作为召回层后的候选集,多路召回可以根据不同的策略生成Top K个物品,再将这不同策略生成的Top K个物品组成真正的候选集。本项目采用embedding召回的方法,计算用户embedding和物品embedding之间相似性,embedding将多路召回使用的热门电影、、物品属性等信息添加到embedding向量中。
2.Spark工作原理:
Stage 内部数据高效并行计算,Stage 边界处进行消耗资源的 shuffle 操作或者最终的 reduce 操作。
3.特征处理方式:
类别型特征;one-Hot,Multi-hot,embedding,数值型特征:归一化,分桶操作。
4.word2vec两种方式:
cbow是通过滑动窗口的方式通过周围词预测当前词,skip-gram通过当前词预测周围词。
5.本项目召回层怎么实现的?
通过局部敏感哈希的方式,计算物品embedding和用户embedding之间相似度
6.载入服务器内的特征有哪些?
由于物品特征较少可以将物品特征存入到服务器内部,然后将用户特征与物品特征计算相似度。
7.冷启动策略
wide&&deep中的wide层就可以看作是冷启动策略中的一种,当样本特征较少可以迅速的召回一些和用户相关联或者用户感兴趣的信息。还有问题类似deep层相比较wide层就没有记忆能力了吗?deep层也有记忆能力,但wide层能更好的实现冷启动策略。
8.Redis存储特点
键值对的存储方式,值可以是各种数据结构。

 类似资料: