面了很久,有100分钟,面试官很认真。 介绍项目 MR的shuffle流程 数据倾斜怎么处理,实际处理过数据倾斜吗(我特老实,我说我没有) spark的宽窄依赖,为什么要划分stage 抽象类和接口的区别 hive的四种排序(简历也没写hive,为啥逮着我问) 问了mysql相关 我简历上所有的组件问了个遍,redis spring druid mybatis,可我当时没准备,就没答出来。。。 设
到店业务 有点久远一直忘了写,就记得这么多 一面: 1、自我介绍 2、比赛中遇到的难点 3、实习中做的项目,聊项目细节 (大部分时间都在问这个) 我好像很多面经都这么简略的写,这次写细点儿哈,里面涉及到的一些知识点,具体项目就不聊了 数仓模型设计方法 数据质量如何判断 如何保障下游查出时间 对于重要程度不同的任务如何合理分配资源 dwd层建模方法,考虑哪些东西 spark任务调参逻辑和常用参数 c
一面(5.5): 1.自我介绍 2.机器学习项目的y值是什么 3.科大讯飞实习有没有发现什么数据 4.两道sql(最大连续登录+两表最值问题) 5.为什么想来互联网 6.入职时间 反问: 1.业务技术占比 2.要用python吗 二面(5.8): 1.自我介绍 2.互联网数分干什么的有了解吗?以后就一直数分吗? 3.广告点击率下降怎么分析 为什么没有互联网实习却能讲这么全面? (因为在牛客 知乎
火车票业务 有点久远一直忘了写,就记得这么多 一面: 1、自我介绍 2、聊实习,扣细节 3、聊实习项目技术难点,聊到了我用later view遇到的坑,面试官直接激动,并表示他前几天也碰到了这个坑,两边都很惊喜,直接惺惺相惜 4、聊竞赛经历,内容以及遇到的难点 5、开始八股,写吐了,这里就省略了,要看的看我之前的帖子 6、sql题,是啥忘了,难度中等吧 7、反问 二面 主管面: 1、自我介绍 2、
一个小姐姐打电话告诉我会议号的。 进去之后,先自我介绍,然后让我讲项目。 hdfs的读写机制 雪花模型星型模型的区别和适用场景 小文件的弊端 又在问项目 20分钟结束了,反问环节都没有。。。
一面面的稀碎,一面面完一周之后hr联系说重新做了人才盘点,希望继续推进后续面试。这次是hr面,问题比较常规。 1.自我介绍 2.离职原因 3.收到offer情况 期间有收到但拒绝掉了,最近也在推动其他 4.看机会比较看重的三个方面 岗位匹配度+发展+薪资 5.工作和上学时间重叠,是管培生吗?签合同时间 校招提前入职实习,签合同是在毕业之后 6.实习和毕业后做的工作差别大吗? 会有差别,组织架构调整
一面 4.27 1.实习经历中详细讲一个项目及产出 2.tableau了解吗(有dashboard项目就没细问? 3.窗口函数了解吗 rank dense_rank row_number 区别 4.abtest流程 5.想来上海长期发展吗,转正意愿? 团队主要负责看板搭建,报告产出 虽然隔了个五一,但好久没消息,估计凉凉,崩铁小保底也歪了,心更累了
4.27 1h B2B,百度电商部门 介绍完自己直接开始写算法题 随机数据的峰值,如 1 2 3 6 5 8 7,返回 6 或 8都行,要求时间复杂度O(lgN) 斐波那契数列,要求时间复杂度O(lgN),矩阵解法 求两个字符串的最长公共子串,如 abcedfgh 和 bcedgh 最长公共子串是bced 求两个字符串的最长公共子序列,如 abcedfgh 和 bcedgh 最长公共子序列是bce
一面:(1h) 1.自我介绍 2.选一个熟悉的项目介绍一下吧 3.看你简历上写了进行过数仓的搭建,那你说一下数仓分几层合适? 4.每一层干了那些事儿? 5.你说一下数仓为何要进行分层? 6.数仓的建模方法知道吗? 7.指标分类有哪些?(回答的是原子指标,派生指标,衍生指标) 8.你的ods层为何选择gzip压缩呢? 9.除了gzip压缩还有哪些压缩方法?介绍他们的区别?10.项目中你的hive表使
公司:联想 岗位:数据挖掘工程师 形式:视频面试 视频面试平台:Teams 面试官:两个人 时长:30分钟 流程: 0、面试官介绍面试流程,因为工作中的有些场合需要英文沟通,所以需要简单了解一下英文水平,自我介绍的时候用英文简单介绍1-2分钟就可以了,然后是15-20分钟的技术测评,最后简单介绍一下之后的流程以及反问。 1、英文自我介绍。 2、为什么想要申请联想的这个实习生岗位?你期望从这段经历中
2023.05.06 午 一面好狠,3个人面了一小时,感觉算是给自己五一之后洗礼了一下了,挺希望能进这家公司的,感觉业务挺不错的。感觉现在面试确实有点像在背书,希望以后深入了解技术和业务,那时候无论简历和面试应该都会看起来很不错。 [TOC] 🔥1.一面 自我介绍 讲下TCP、UDP,HTTP,为什么三次握手四次回收:前2个是传输层,后一个是应用层,然后三握四挥都是为了防止服务器资源持续等待导致
岗位:大数据开发工程师 题型分布: 单选5道:多线程程序补充、Oracle分组关键词、快排最坏时间复杂度、正则表达式匹配所有数字式子、广播变量相关选项 不定项选择8题:视图优点、方法重载、封装、分布式系统设计策略、Spark RDD特点、算法复杂性、不宜建立索引情况、索引目的 填空4题: 1.通信电文由{a,b,c,d,e,f,g}中的字母构成,在电文中出现的频率分别为:{0.31,0.16,0.
时间线:3.28笔试;4.10一面;4.17二面;5.5发邮件询问进度后收到感谢信 地点:上海 一面(一小时 1. K3S kubeedge有什么区别 2. kubeedge边缘自治体现在哪里 3. k8s架构介绍 4. kubeedge安装过程 5. K8s资源类型 6. 使用过Python什么(答的flask,让介绍 7. 介绍下Restful 8. python数据类型 9. 链表 数组区别
BOSS投的简历,电话面试。 1)HashMap原理(扩容机制,JDK7、8的实现区别) 这里拓展说了为啥是以2的倍数进行扩容,什么时候感知到树化和链表化,以及线程安全的ConcurrentHashMap的原理,分段锁和节点锁。 2)锁的分类,具体用过哪些锁,Sycnized和lock的区别 这里顺着第一问问的,没回答好,说到了JVM实现Sycnized的一些流程,对象头记录锁信息之类的。lock
4.23 官网投递简历 4.25 hr联系约一面 4.27 一面 4.28 二面 4.28 三面(hr面) 5.3 发offer bg:本硕华五,天坑专业,无实习经历,几场数模比赛水奖 一面:一个面试官,字节飞书,20min左右 一面感觉没有太偏重技术,一上来先是自我介绍,然后让我选简历上的一个项目从背景、到过程、到最后输出结果整个流程讲一次,着重讲一下中间遇到的数据清洗、数据处理等的过程。我讲的