当前位置: 首页 > 面试经验 >

数据科学面经(互联网+金融+制造业+咨询)

优质
小牛编辑
105浏览
2023-03-28

数据科学面经(互联网+金融+制造业+咨询)

IBM还没面完,持续更新中......
哈罗单车 45分钟 3.21 二
自我介绍
-问了下团队的人数、以及分工情况。
-问了下腾讯的异动检测项目,背景是啥,以及怎么做的
-问了招商的推荐项目背景是啥,怎么做的
-深挖了下随机森林和xgb的重要性怎么计算的。
-介绍下逻辑回归算法
-问了下因果推断是如何应用的
-模型是怎么评估的
QA环节
个人
Q1:期望这个岗位解决什么样的问题
A:支持保险、信用贷款的场景的用户增长
Q2:职位的发展路径是什么
A:没有明确的晋升机制,考核是一年为期
Q3:对优秀定义和标准
A:持续的学习能力,应变能力
团队
Q1:对未来一段的时间的规划
A:说的比较含糊,只说了他们现在有100多号人,这个部门是数据科学团队
字节跳动 1个小时 3.10 五
二面 3.13 一
面试官介绍了面试的组成部分和流程环节
1.自我介绍
2.从金融机构项目问起
* 让我用做这个件的背景、和产生的价值,以及用了什么方法,最后产生的结果讲下?
-流失客户的大盘池子
-正负样本是什么
-模型效果是怎么跟进的
-如果一个模型效果未达到预期,怎么进行优化
-特征清洗是否用到一些自动分割的方法
-了解孤立森林么
3.介绍下互联网项目
* 分别从你们为什么做,怎么做的,做的怎么样三个角色介绍下(star法则)
-里面有做归因么
-你们的精准率和召回率为什么这么高
-了解现在主流的时间序列模型么
-补充了下深度学习算法,以及有监督的,并说了下为什么我们不用。
4.QA环节
介绍了他们现在服务的核心指标风险、服务、收益
以及团队的在做的什么事。接下来要支持的事情等。
还有怎么考核啊,怎么成长等
一面 3.10 五
自我介绍
项目介绍
Q:保险项目是在流失召回还是其他
智能异动风险项目
Q1:能介绍一两个指标应用?
产品画像标签体系项目介绍下
NPS的计算介绍下,你们产品的用户是谁
置信区间介绍下
样本量的预估是怎么计算的
一类错误率和二类错误率
QA:
介绍了下自己的选择标准
保证风险的情况下看收益
团队晋升每半年一次,还是看实际产出为主。
部门规划:主要围绕整个中国区的安全,并挂在整个商业化团队下,负责的是
对多个产品的风险控制,会跟产品的寿命周期进行策略的部署。
美的集团 1个小时 3.8 三
* 自我介绍
* 项目介绍
背景没有说清楚,详细问了几下
问了怎么实现的,以及对时间序列算法怎么处理多个指标进行了追问
* 算法相关
了解lstm、rnn等时间序列么?
讲下xgb算法的优缺点?他为何要二阶泰勒展开
-特征工程
算法的梯度爆炸怎么解决
什么是过拟合
做过文本相关的项目不?
了解bert、transform算法不
用的是什么框架。用spark介绍下其用作机理?是keras还是tensorflow
-模型评估,讲下roc曲线
* QA答题环节
-业务:
公司内部的金融贷款,风险相关的都做
-考核和评价:
主要看对业务降低的成本,对算法的应用能力
-人员结构
团队目前有30多个人,传统主要以规则进行风险判别。现在想做的一件事就是用科学的方法驱动。
-个人成长
两条线,专业和管理线。每半年考核一次。
平安产险 1个小时
自我介绍
挑几个项目讲下
—项目讲的过细了,被打断了
结果如何
效率是怎么计算的
挑几个算法讲下优缺点
PPT的使用情况如何,以及汇报能力如何
隆基股份 1.2个小时(六面完毕)
自我介绍 10分钟
算法面试
描述下决策树算法与XGB有什么不同
XGB的二阶泰勒展开优点在哪里
XGB算法的基模型决策树原理
几个决策树算法的不同
项目面试
- [ ] 智能风险异动讲下
-挑几个指标的概念讲下
-规则的有无自动化
-如何评估的
- [ ] 民生银行的召回模型
-样本挑选怎么样
-指标特征怎么选的
- [ ] NLP智能平台
-如何建立的
 类似资料: