先说下专业,不是专门学计算机的,是数学院信息与计算科学 上个月快月底的时候投了数据分析的简历,过了两天一看,“笔试名单筛选中”,又过了两天,“未通过”,好家伙直接没了,所以就没管了 但是前几天突然收到了笔试的通知,但是“数据工程师” 看了下别人的笔试经验发现是有选择有编程,编程是sql 我确实会sql,但是有段时间没接触了,于是昨天练了一整晚,回忆了个七七八八 想着早点考早超生,今晚就给考了 看到
因为我投的是供应链这边的数据分析岗位,所以大多都问的数据库使用和coding的问题 一面-8.26-28min 1.问项目中解决的问题和反思。 2.java中ConcurrentHashMap的各种机制? 3.JVM模型,GC算法,为什么要把元空间的实现从永久代放入对外内存? 前两个问题就是意思一下,最后一个问题就是见功力了。 主要原因1.是为了避免OOM,很难预测方法区大小是多少,故很可能发生O
之前一直在牛客找面经,对自己帮助也很大,意向了也写一篇,感谢! 一面: 1、介绍项目 2、ODS和DWD怎么区分,分别存什么样的数据 4、跨数据域问题,怎么做的 5、有哪些宽表,对应什么指标和业务过程 6、留存率、漏斗分析等,是怎样的开发过程,后续使用 7、任务性能优化或代码方面的优化 8、hive on spark和spark区别,计算时间上有差异吗 9、kylin为什么快 10、两道SQL
已OC,朋友们明年广州见。大家都好运! ———— 三面人力面: 无技术问题。 1.自我介绍 2.学校是否有社团活动经历,请简述 3.根据社团活动经历,说说自己的输出 4.实习经历有什么具体的项目分享 5.因为我实习做的是政企数字化改革,所以在实习经历上又深挖了流程 6.觉得压力最大的一次经历,以及自己是如何做好的 7.职业规划 8.根据简历上的兴趣爱好(我自己有做短视频和b站up),问了我的粉丝量
大数据开发岗 10.12一面 自我介绍+介绍项目及难点,面试感觉很好。 各个大数据组件都问了一点点(hive文件的格式,两种行式两种列式,项目中parquet+lzo,几种压缩方式的对比,spark rdd+df+ds区别,repartition+coalesce,reducebykey+groupbykey,kafka ack,flume数据重复等) 数据来源(结构化sqoop+半结构化flum
时间线:8.26一面——9.10二面——9.26三面—— 9.29三面——10月底意向 一面 简历部分 ①实习项目---建议如何来的 答:从结论某个数字出发,来提炼项目的介绍思路 场景题 ①淘宝加历史价格曲线的功能,如何用abtest衡量是否上线? 答:abtest,指标体系,大致流程 ②接上gmv之外的核心指标? ③接上如何量化用户的价格敏感度? 答:回答思路是用个人和大盘指标比,指标定义为用户
估计自己凉了,没想到一面是技术面试,而且问得特别详细,首先:你先做个简单的自我介绍,然后在介绍一下你觉得比较能讲的自己的项目。然后针对于我的项目细到了问我的cnn使用的哪一种核心架构,然后我回答不出来他提示我说是自己写的架构还是用的比较经典的。输入数据是几维,输出是几维,怎么输入的。然后问我用的激活函数是relu还什么,然后问我为什么用relu,问的深度学习里的东西特别细。因为我之前做的项目还有个
视频面,1h 吐槽:我8.11投递的岗位...八月底做完的笔试....10.21给我发邮箱约面,也不知道前面是哪个大佬拒了offer然后把我给捞上来了 但是,面试官人很好啊~面试体验很好~ 虽然我很多没答上来只能说分治思想贯穿了全程... 无自我介绍 实习 由于我有数据开发相关的实习,所以前30min各种问实习 做了哪些工作,怎么做的,任务挂了怎么办,怎么做的清洗,用的啥语言,用的是啥架构/工具?
一面9.18 群面,而且和mkt、市场等背景的同学,海外高校居多,还有位清华本硕小姐姐惊呆我了。 选一个行业,讨论行业转型的痛点和方案及价值 (本以为过不了,不过从这次从其它岗位的同学上学到了很多群面的技巧,有时间再系统总结一下) 二面9.25 介绍实习 公司类型倾向 有没有数据质量的处理经历 base天津,一次非传统的面试经历?一般联想这个岗位好像也不会群面,后来oc发现是捞起来给了
20221025联想数开笔试 写在前面:前几天投的,今天接到笔试,在这里记录下,有点遗憾,第一题本来有思路,但是怎么改都过不了,实在受不了就交了,后来试了下,是最后判断的时候出了一点问题……还是得有耐心,这里只记算法题,题型是60分选择,40分编程 算法一 翻转硬币,给你一堆硬币,然后你可以从左翻,也可以从右翻,但是无论左右,都必须从左边第一个或者右边第一个开始翻(也就是说得翻从第一个位置到当前位
1、自我介绍 2、数据仓库为什么要分层,目的是什么 3、DWS层和DWT层是怎样划分的 4、PV和UV分别是什么 5、数据仓库建模的两种形式 6、范式建模中的第三范式的原则 7、维度建模中最常见的建模形式是什么区别是什么 8、如何评判数仓的优劣性 9、MR流程是写的MR程序,还是通过hql 10、用户留存率的计算公式 11、HDFS的写流程 12、MR的底层原理 13、MR
投递的是到店,被买菜事业部捞起来 一面 一位小姐姐面试官,全身洋溢着令人舒适的气息。 深挖简历每一段实习,细节问的很深入,以及部门为什么做的动因。 二面 从宏观、中观、微观来分别评价下美团买菜目前的优势劣势,以及和其它对手的对比,有提及到像是盒马、朴朴、叮咚买菜等竞争对手。 反问:面试官表示集团对买菜业务很看重,并且自己希望招到兼有战略、数分、经营等多方面经验技能的校招生。 面试全程30-40mi
背景:双211,研究方向:计算机视觉(遥感变化检测) 一志愿:AI算法(应该是挂了一志愿) 二志愿:数分 10.26上午 腾讯会议视频面试 1个hr/3个面试官 1.自我介绍 2.有没有实习? 3.介绍一个项目所做的工作 4.技术栈:会什么编程语言,数据处理都是自己用python写的方法吗?有没有使用过什么大型数据处理软件或许使用过哪些python数据分析库 ? 5.了不了解结构化数据,大数据?(
原定14.30进场(14.37才进。。。) 1. 自我介绍2min 2. 上一段实习都做了什么 3 4问的两个实习项目用到的算法 5. hive sql 区别 6. hive底层原理知道吗(不知道) 7. Python数据处理用啥包 8. 实习算法实现是调包还是(当然是调包呀😬) 8. 反问 出面试间的时间倒是贼准😅。。。(14.50) 呜呜呜可能是对我不感兴趣?别人问20min为啥俺就13m
相关经历:一段银行对口方向的风险建模实习 一面 部门负责人 深挖实习建模(数据提取、建模选择该模型的原因),以及当时的公司一些风控的流程 最后用了多少特征 有什么可以改进的地方 稳定性的问题 项目-ks值低 风险策略和模型的关系理解 二面 交叉面 建模的思路出发点、结论是什么 怎么区分的好坏样本,出于什么考虑?正负样本的比例多少? 模型的稳定性怎么看? 特征有哪些? LDA抽了哪些主题? 注册时长