简历没写算法和机器学习的东西,就只是方向是这个,然后面试的时候机器学习问好多?真的是有点懵 一面问nlp,二面问我会不会协同过滤,明明招数仓,数仓东西又不问,真的是服 8.29 一面 全程 30min不到 自我介绍 数仓的优势 介绍下数据库的范式 介绍项目中的Flume 常用的语言有哪些?Java和Scala的区别?什么是范式编程? 设计模式了解多少? ETL步骤 常用的机器学习算法?随机森林主
时长:28min 1、自我介绍(说了实习期间做的工作,主要是做数仓) 2、面试官拿着简历开始问,问着问着我发现不对劲, 我:“您好,您是不是拿错简历了?”, 面试:“你不是XXX吗?” 我:“不是” 面试官:“稍等,我找一下,你继续说你的”。(我又把做了一遍自我介绍) 3、你说一下你在实习期间做的工作。。。(又说了一遍实习工作) 4、你说的都是业务上的问题,有没有技
奇点云实习 商业分析师 自我介绍 问为什么转行 简历里面契合公司的项目的提问 sql基本问题询问 python怎么用
部门:网易云 8.23约面,8.25 一面 8.29 二面。8.30 hr面 一面: 45min左右 1.自我介绍 2.说说项目用到了哪些技术 3.你刚刚说到了即席查询,项目里是怎么做的。 4.四道sql,十分钟后对答案 5.笛卡尔积了解吗。 6.笛卡尔积会产生什么问题。 7.你刚刚说到了数据倾斜。介绍一下。 8.笛卡尔积就会产生数据倾斜吗 9.mr流程介绍一下 10.你多久能来实习 11.你刚刚
今天!必须得给我美团一面面试官一个爆夸!!!秋招一直没发过面经,但是这次面试体验太好了!必须给面试官一个夸夸记录一下。虽然我挂了哈哈哈哈,但是和前辈交流真的会让你有很多收获。 投的是软件开发岗位,面试官说他们是做数据开发的(我没听过),然后说是做大数据的(我没接触过,也就本科上过课),面试官说可能面试要问很多大数据相关的内容(可能确实不太匹配哈哈哈),如果于是画风开始走偏。面试官开始给我科普大数据
实习部门:商业产品 实习时间:2021/11 - 2022/02 一面:2021/10/22 自我介绍 SQL各种join的区别 比如抖音上有一个广告的收益下降了,从哪些角度分析下降原因? 你的优点和缺点 二面:2021/10/27 自我介绍 问简历上的工作内容或者项目 熟悉哪些平台?使用XX发现哪些不满意的地方?假设你想看的数据应有尽有,如何分析用户流失是否是推送过于频繁导致的呢? 三面:202
总评:整体面试难度对我来说还是比较大的,主要是因为对于游戏业务不熟悉,之前接触的更多是广告变现和电商业务。问了很多moba相关游戏细节,关于用户体验方向,确实了解比较少,还得多弥补下。 一、简历深耕: 1. 关联规则挖掘项目的背景,结果详细说下? 算法支持度和置信度阈值如何设定的? 2. 建立用户转化分类模型怎么选取特征的?承接策略有哪些? 3. 选
字节面试 ● 一面:50min ● 1、优缺点 ● 2、近三年想做的工作,目标 ● 3、用过python哪些库 ● 4、是否用过可视化工具,tableau ● 5、如果设备出现问题了,应该怎么分析 ● 6、介绍下时间序列分析 ● 7、选择北京的原因 ● 8、能承受多大的压力 ● 9、数据分析师要具备的能力 ● 10、数据分析和数据建模的区别 ● 二面:45min ●
1、spark shuffle过程,越具体越好,细化到组件,map task以及reduce task具体过程 2、你说bypass shuffle是每个executor节点生成对应reduce task数量的结果文件,那mergesort shuffle呢 3、reduce task 如何知道哪些map task完成了,又是怎么拉取的 4、spark 写文件流程?commit流程? 5、spar
26号一面,9月1号二面,做PPT,许愿offer 1. 自我介绍 2. 项目PPT汇报 3. 根据PPT提问,然后我发现项目开头可能就出了点问题但是这需求是人家提的呀,就给了这么点东西,只能硬做,非科班转行好难呀 4. Python掌握的咋样 sql掌握的咋样,索引,视图 5. 为啥转行 6. 转行会后悔吗,想去哪工作啊,哪人啊(我说河南人,但是有计划单列能落户北京) 7. 期望薪资 反问: 1
8月31日一面,两位面试官,2V1,时长约1小时,两位面试官都很温和,整体的面试体验感觉很好,面试氛围超好 自我介绍 针对所修专业开始提问 你的专业做数据分析相比于统计学/数学有什么特殊之处? 你的专业做数据分析有什么优势? 介绍其中一段实习经历 实习中使用到的一个预测模型处理的数据大约有多少条记录?时间跨度有多长?用的训练集占多少? 对于这个项目,当时是怎么分工的? 有遇到什么问题,是怎么解决的
说明一下我面试的岗位是数据研发 8月31号快手一面1小时: 面试官是个小姐姐,很和蔼! 1.自我介绍 2.问滴滴和字节实习主要做的工作? 3.介绍一下字节的大数据架构? 4.说一下你们部门数据仓库的建设? 5.和滴滴相比,你觉得差异在哪里? 6.在需求过程中有没有遇到什么难处理的数据问题? 7.就拿数据倾斜来说,你有几种处理方式 8.你是做离线还是实时的? 9.某个离线任务出现了问题,你会如何解决
1.mapreduce的shuffle过程。 2.海量节点的情况下,NameNode如何扩展用多台NameNode保存元数据。 3.多个NameNode,其中一个NameNode挂了,其它NameNode如何上线。 4.海量的(userid,pageid)二元组数据,内存小的情况,用java或者sql计算每个pageid的userid top10的方法? Java:数据切块并按pageid分区,每
女面试官:人超级nice hadoop搭建过程中有哪些注意点 hive怎么进行优化 jar包冲突了怎么解决? hive和sql有什么区别 后面基本就八股了 八股背的太不熟了 jvm是什么 == 和 equle有什么区别 面试官全程引导,会说自己的想法人超级棒(我觉得我挂啦,现在就回去背八股呜呜呜) #度小满#
1.自我介绍 2.实习项目深挖(数仓) 3.主要负责哪一部分? 4.在数仓建设中做了什么? 5.如何去建立数仓表并规范化?(这是我上面提到的) 6.在建设数仓表的过程中数据有丢失怎么处理? 7.每天拉取数据的时间点,拉取数据任务中会注意什么?(任务是否有延迟,造成延迟的原因,是否有数据异常) 8.会有数据异常报警吗?怎么看数据是否异常?(根据数据量是否正常,数据会存在部分丢失,但是如果是在一定的范