当前位置: 首页 > 面试经验 >

数据模型面试题与解析1

优质
小牛编辑
140浏览
2023-03-28

数据模型面试题与解析1




面试高频题1:


题目:介绍一下k-means,你的数据如何处理,模型的输出是什么?


答案解析:


介绍kmeans:



第一步:数据归一化、离群点处理后,随机选择k个聚类质心



第二步:所有数据点关联划分到离自己最近的质心,形成k个簇;



第三步:重新计算每个簇的质心;



重复第二步、第三步,直到簇不发生变化或达到最大迭代次数;




数据如何处理:



为了防止均值和方差大的维度将对数据的聚类产生决定性影响,所以在聚类前我们对数据进行了归一化处理。




模型输出:



n个维度,输出为 的向量。[0 1 1 0 1],就是把第1,4维分为一类,其他分为另一类。





面试高频题2:


题目:特征工程怎么做的,选择了哪些特征作为预测变量?为什么用RFM模型来构建特征变量?


答案解析:


特征工程包括:


特征构建->特征提取->特征选择。


选择特征:


用户行为特征、用户消费特征、用户画像特征 为什么RFM模型:


因为我们没有太多的用户行为数据,能用的数据比较有限。但是有一定的成交数据。只要有成交数据,就能进行RFM的分析。其次,模型的分层可解释性强。其他很多算法模型、机器学习模型,往往通过聚类进行用户的分层,对于业务来讲,不是很好解释。但RFM模型分成的用户类别,是非常好理解的。



面试高频题3:


题目:RFM模型介绍一下?


答案解析:


RFM模型根据客户活跃程度和交易金额的贡献,进行客户价值细分的 一种方法。它能够识别优质客户;可以制定个性化的沟通和营销服务,为更多的营销决策提供有力支持;能够衡量客户价值和客户利润创收能力。 R(Recency)



 类似资料: