面试高频题11: 题目:算法部门上线了新的推荐算法,在ab-test中败给了老算法,让你找出其中的原因,需要说出具体思路和框架 答案解析: 电商平台的商品推荐中,商品历经曝光、点击、加购物车、下单这一系列漏斗。应该分别比较两个算法推荐商品在各环节的转化率,并针对不同环节寻找原因。如果较老算法而言,新算法推的商品从曝光至点击的转化率很低,则应该从推荐推送客群的画像思考,说明推荐算法推送的商品并不适合
#校招# 刚刚面完,感觉面试官没啥耐心,都没怎么问就结束了 背景23应届双非硕,搞的机器学习,时间线:9.9投递,10.25笔试,11.2一面 问题: 1.在你说的数据分析经历里面挑一个说说你在里面用数据分析做了什么贡献,带来了什么价值能让你有成就感。 2.我看你的数据分析更偏向研究方向,你是怎么了解到我们公司的数据分析岗位,你觉得我们公司这个岗位日常是干啥的。(说实话这个问题没答好)
1-4面为春招实习,很遗憾最终没有通过,5-8面为秋招投递同一个部门,hr面后通知说换了一个组加一轮技术面和hr面,总体来讲实习面试更侧重实验室项目,秋招面试会细聊实习工作,每一轮的面试官都很nice,也都是一次很好的学习经历,感恩这一年和蚂蚁的相遇~ 一面(技术面) 介绍项目 遇到了什么问题 怎么解决的 介绍一下大数据的发展历程 项目选型,为什么用这些组件 介绍另一个项目 除了准确率还用了什么指
面试高频题1: 题目:说一说数据分析流程 答案解析: 第一步: 与业务方沟通问题,明确分析目标; 第二步: 对目标进行拆解,可以采用两步分析法,也可以采用人货场分析法,通过数据定位问题源头; 这里可以通过计算各个维度该指标的变动系数=(指标异常前-指标异常后)/指标异常前,选出变动系数较大的前几个维度,对其进行分析 第三步:与产品、运营和技术沟通,找到问题原因。 面试高频题2: 题目:指标异动的分
面试高频题13: 题目:用户有目的的访问app(例如搜索女装),但是下单量较少怎么分析 答案解析: 漏斗分析。 下单转化漏斗:访问app--商品详情页--购买页面--支付页面--支付成功。 定位是哪个环节出现问题后,与技术人员和产品人员沟通,找到原因。 面试高频题14: 题目:如果近期贝壳二手房成交量下跌,怎么分析 答案解析: 首先,按照省市、价格区间等维度划分,找到是哪个维度下的二手房成交量下跌
面试高频题21: 题目:一家实体零售企业发现本月销售额同比下降30%,如何来分析销售额同比下滑的原因呢? 答案解析: 业务模型初步分析: 实体零售一般是以全国-大区-小区-单店的管理模型进行运营。 逻辑拆解: ①内外部大环境判断: 外部环境(PEST): 政策:如国家出台有关政策。 经济:如市场经济环境影响,竞品的影响。 社会:如社会上产生不利于舆论。 科技:如新技术出现并没有促进消费,反而产生不
面试高频题1: 题目:谈谈对短视频行业的理解 答案解析: 首先,该行业中长期来看会往哪个方向走: 短期和长期该行业都有着蓬勃向上的发展趋势,市场规模非常庞大,18年增长率超过了700%,虽然现在增长率放缓,但规模仍在增长。 其次,识别出这个行业的关键风险和成功的驱动因素: 内容生产者的质量,人们碎片化的时间等(本质上是内容行业,需要靠内容吸引用户) 最后,这个行业成功的企业和失败的企业大概都有哪些
面试高频题1: 题目:讲一下Union和Join的区别 答案解析: UNION是两张表进行上下拼接,产生的两个记录集(字段要一样的)并在一起,成为一个新的记录集,分为UNION和UNION ALL两种方法; JOIN 是两张表进行左右连接,条件匹配的记录将合并产生一个记录集,有LEFT JOIN、RIGHT JOIN、INNER JOIN、OUTER JOIN等多种方法。 面试高频题2: 题目:说
面试高频题1: 题目:抖音的盈利模式 答案解析: 1. B2B 收入 抖音利用网红和品牌合作的伙伴关系盈利 2. 品牌滤镜 在抖音上,用户可以给短视频添加滤镜。一些品牌可能会为用户添加专属滤镜,让用户把品牌添加到他们的视频里面。然后,他们可能会请网红主播用这个滤镜拍摄短视频,其他用户看到之后就会跟着使用。一些品牌方可能会造势和滤镜搭配宣传。 在抖音上,用户可以创建音频并上传到平台供其他人使用。这个
面试高频题1: 题目:介绍一下k-means,你的数据如何处理,模型的输出是什么? 答案解析: 介绍kmeans: 第一步:数据归一化、离群点处理后,随机选择k个聚类质心 第二步:所有数据点关联划分到离自己最近的质心,形成k个簇; 第三步:重新计算每个簇的质心; 重复第二步、第三步,直到簇不发生变化或达到最大迭代次数; 数据如何处理: 为了防止均值和方差大的维度将对数据的聚类产生决定性影响,所以在
面试高频题1: 题目:了解决策树吗 答案解析: 决策树是一种机器学习的方法。决策树的生成算法有ID3, C4.5和C5.0等。决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果。 决策树的构造过程: 决策树的构造过程一般分为3个部分,分别是特征选择、决策树生产和决策树裁剪。 (1)特征选择: 特征选择表示从众多的特征中选择一个
面试高频题11: 题目:L1、L2的原理?两者区别? 答案解析: 原理: L1正则是基于L1范数和项,即参数的绝对值和参数的积项;L2正则是基于L2范数,即在目标函数后面加上参数的平方和与参数的积项。 区别: 1.鲁棒性:L1对异常点不敏感,L2对异常点有放大效果。 2.稳定性:对于新数据的调整,L1变动很大,L2整体变动不大。 答案解析 数据分析只需要简单知道原理和区别就行,公式推导不需要,面试
面试高频题1: 题目:统计学的基本方法论,也就是拿到数据怎么分析 答案解析: 统计学是一门综合性的学科,会通过收集、处理、分析、描述等一系列步骤从数据中得出结论。以下分别介绍包括描述统计和推断统计在内的统计学的基本方法论,以这两种方法论为分析主线能够较为全面地对数据进行分析。 1) 描述统计 描述统计通过图表或数学方法,对样本数据进行整理、分析,然后概括总结出反映客观现象的规律。其中图表描述方法就
面试高频题11: 题目:辛普森悖论,以及如何避免这种现象 答案解析: ⾟普森悖论指在某个条件下的两组数据,分别讨论时都会满⾜某种性质,可是⼀旦合并考虑却可能导致相反的结论。为了避免⾟普森悖论导致我们得出两个相反的结论,我们需要选择将数据分组或将 它们聚合在⼀起。其中我们要学会思考因果关系:数据如何⽣成,基于此,哪些因素会影响我们未展示的结果? 例如美国加州大学研究生录取数据的分析中,目的是探究伯利
面试高频题1: 题目:处理噪声数据方法 答案解析: 1、分箱 分箱方法是一种简单常用的预处理方法,通过考察相邻数据来确定最终值。所谓“分箱”,实际上就是按照属性值划分的子区间,如果一个属性值处于某个子区间范围内,就称把该属性值放进这个子区间所代表的“箱子”内。把待处理的数据(某列属性值)按照一定的规则放进一些箱子中,考察每一个箱子中的数据,采用某种方法分别对各个箱子中的数据进行处理。在采用分箱技术