1.自我介绍 2.项目细节介绍 3.针对一个指标讲讲你整个链路怎么设计的 4.数据交付时数据质量如何保证 5.如果现在调度的表都是高优先级,你这个表延迟产出了,怎么办 6.hive架构介绍 7.hive优化器会做什么,详细讲讲谓词下推 8.小文件产生原因,危害,解决方法 9.spark遇到的挑战 10.实时了解过吗 11.你们公司的数据链路,数仓分层是怎么样的 12.数据怎么采集的,binglog
已挂, 秋招首挂,攒攒人品继续秋招!!! 刚实习完回来啥都忘的差不多了,好多八股问我的时候都大脑一片空白,结结巴巴的开始讲。 以及刚回学校面试的环境都没好, 垃圾校园网这个老楼里根本没信号, 师弟接的wifi也上不去网, 10min都没能进去,还迟到了1min。。。 到点的时候啥都打不开了, 赶紧打电话道歉说我在全力联网, 最后搬着电脑站在窗户边上面的,,,,中途让我手撕的时候一直加载不出来题,
短信通知腾讯会议号,无其他联系方式。 通知的是上午9:00到11:00,但是我等到11点多才面试,两个面试官。 1.自我介绍 2.介绍一个项目所做的工作背景,难点,创新点。 3.这个项目你继续完善的话会做些什么? 4.基础机器学习算法了解哪些?简单介绍一下(我回答的逻辑回归,决策树) 5.会不会sql? 6.另一个面试官看我有JavaWeb的经历,问了这段项目耗时及所做的工作,说他们也招前端后端开
交叉面一面 70min 手撕:二叉树的非递归中序遍历;快排; 1. 做了一些基础知识题,涉及内容包括:指针和引用,select/poll/epoll对比,有两张表,都有id列,都是主键,怎么查出在两表均有的记录(即交集),并按照指定的两个字段排序,用一条sql语句实现。(INNER JOIN,ORDER BY 堆排序的过程;结构体的内存对齐; 2. tcp三次握手改成两次会有什么问题 3. 项目中
时间:2024/08/15 16:00(90分钟) 考虑将两条车道建模成图,一条车道是1-2-3-4-5...,另一条是11-22-33-44-55...,对应连边1-11,2-22,3-33... 1. 如果4-5发生拥堵,有的司机会变道走4-44-55-5,有的司机不会,根据经验如何建模这个问题(提了下引入概率,但说得不充分,总之是转化成问题2) 2. 每个节点有个变道成功概率pi,每条边有时
时间:2024/08/09 14:00(30分钟) 补了一下上次没答好的盲人过马路问题,具体可看之前的帖,总之盲人出发前速度一定要保证在一个“安全”范围,这个范围要么是你刹车能停在盲人前面,要么是你加油门能直接在盲人到之前过去,而这两个速度临界值随距离的变化可能会有个交点,交点处可以从一个策略变为另一个策略 概率论题:n个独立的随机变量满足[0, 1]均匀分布,问它们的和小于1的概率 用几何概型推
时间:2024/07/29 17:00(60分钟) 八股:vector底层(答到size达到capacity时扩容就差不多了),为什么扩容是1.5到2倍(时间和空间的tradeoff),push_back复杂度(均摊常数) 手撕:给定一个红绿灯的位置坐标和高度,给若干障碍物凸多边形柱体顶点坐标和高度,每次询问对于一辆车的位置和高度判断其是否能看到红绿灯 这个问题感觉就是我说了我比较擅长计算几何后给
2024/08/02 14:00(100分钟) 编程题:n个离散随机变量,给出每个随机变量的取值与概率,求所有随机变量的最大值的数学期望 令f(x)为所有随机变量小于等于x的概率,可知f(x)等于各个随机变量小于等于x的概率之积,很容易求出来,那么f(x)-f(x-1)即为所有随机变量的最大值等于x的概率,进而求得期望 数学建模题:一辆长度为L宽度为W的车起始中心在原点,可以向x轴正方向移动,一个
2024/07/26 14:00 (40分钟) 场景题:黄灯时间和道路限速的关系 要考虑到两个场景,一个是距离较长时刹车停下来,另一个是距离较短时不刹车直接过去,而黄灯时间则需要保证后者不会闯红灯,可以得到两种情况的临界距离是 v0^2/2a,黄灯时间不能少于这个距离下不刹车通过的时间,即 v0/2a 编程题:平面上n个点,求最多选出多少个点,使得点集中没有x1<=x2且y1<=y2的点对 选出的
写面经攒人品了~~~ 自我介绍 八股文拷打 1、数据库:mysql联合查询了解吗(左联右联内联) 2、数据库:数据库中事务了解吗?银行取钱要执行三步,如果钱取了在最后一步扣余额的时候网络故障怎么办?(事务执行的原子性,会回滚) 3、cpp:指针和引用区别,指针可以指向一个空值吗?引用对象可以为空吗?引用的对象可以改变吗? 4、cpp:智能指针了解吗?说两个重要的;当三个share_ptr指向同一块
9月下旬投递并进行笔试 base南京 偏底层嵌入式开发 国庆末进行一面,问项目和解决方案 之后约了二面,听说二面是群面,放弃了
27号晚上面的,问的几乎都回答出来了,手撕一道hard题也10分钟内做完了,反问环节面试官还说我基础挺扎实,项目比赛啥的也挺好。 28号美团打电话问我想去去上海还是北京,喜欢搞技术、算法还是业务,回答的都可以,我以为1面肯定没问题的。 结果29号早上刷新进入人才库,麻了
时间:25分钟 1.自我介绍 2.简历深挖 1)细问问卷调查项目经历(包括项目周期为什么这么长?问卷停留时长改善的原因是什么?项目回收数据不错,怎么做到的?有没有具体的激励等等) 2)如何触达海外用户进行调研和访谈 这个问题回答得比较差,简单回答了针对用户画像,寻找用户痛点,针对未解决的问题进行定性与定量研究之类,但总感觉不是面试官想要的,不知道如何把这个宽泛的问题回答得细致。 3)职业规划是什么
阿里云数据开发一面,问项目穿插八股,本帖就只记录一下八股部分 1.三范式是什么 2.Spark RDD和DataFrame的区别 3.Spark涉及shuffle的具体算子 4.MySQL存储引擎是什么 5.MySQL存储的结构是什么,为什么不能用特别长的key 6.使用过哪些大数据框架 7SQL的窗口函数,什么作用,具体例子 8.了解过云计算吗 9.springboot会用吗
bg双非 4.05投递 两轮简历筛选免笔试约面 4.25电话约面 4.29一面 自我介绍 聊A项目 项目架构,了解DDD吗? 怎么做的全链路追踪,原理?要实现对某一个组件做追踪怎么做? 说一下GRPC,是基于什么协议做的?支持跨语言吗?平时是怎么用的。你这个是基于GRPC的拦截器做的吗?说一下怎么做的? 聊代码规范性+编程注意的点 redis的内存淘汰机制 Mysql的索引使用场景,项目中有没有使