当前位置: 首页 > 面试经验 >

经纬恒润 数据分析面经

优质
小牛编辑
115浏览
2023-03-28

经纬恒润  数据分析面经

#校招# #面经#
攒攒人品许愿offer
8.19日投递 8.21约26号面试 时长40min
1. 自我介绍
2. 项目深挖(为啥最后改成降维了,xgb和rf为啥效果不好)
3. 说说决策树,随机森林,XGBoost
4. 说说随机森林的随机主要体现在什么方面?(回答主要是随机取样之类的,问还有吗,没了)
5. 已知学习率,n,随机森林取样取不到某个样的的极限是什么(不会)
6. 假设检验的流程,z,t检验分别适合什么?
7. Python掌握的包
(pandas,sklearn,numpy)
8. pandas的连接字段
(我傻了,只回答了join,给how和on指定参数)
9. sql掌握状况
(增删改查,开窗之类的)
10. 查询函数用的多,然后有个表,姓名为主键,班级,分数,选择每个班级最高分数该列信息
(聚合函数+group by,再嵌套一下;还可以用聚合函数+开窗函数partition by class)
11. 数据库底层原理懂吗?
(不懂)
12. 数据结构之类的,leecode刷了多少?
(不到200道,其中有几十道是sql)
13. 刷哪些题?
(剑指offer(我傻了以后就该回答列表,字符串之类的))
14. leecode的第一道解法?
(我说两数之和吗?首先可以用暴力解法)
15. 还有其他解法吗?
(字典记录数字,key value分别是数字和数量,用c-a=b去查询b的value是否大于0)
16. 除了字典,Python还有哪些内置的数据结构之类的?
(我问可以回答数据类型吗,他说可以,整型,浮点型,布尔型,字典,列表,元组,忘了说字符串)
17. 哪些是不可更改的?
(忘了字符串说元组不可变)
18. 快速排序算法思想?
(面试官说我说的有点似是而非)
19. k-means算法思想?
(blabla答的还行)
20. k-means有啥局限性?
(只适用于球形分布的数据,容易产生局部最优解,k要在一开始的时候确定,面试官说,除此之外还有吗?我说没了)
21. k-maens的k主要怎么确定?
(从业务的角度,从散点图的角度确定)
还有其他的吗?
(不清楚,下来看了一下,做项目的时候其实用到过,肘部法,轮廓系数法)
字数限制了
 类似资料: