周六晚上九点半面???两个面试官问我文章情况 ,我解释了一下反问我什么是paper???之后项目介绍(实验室跟航天那边合作的操作系统形式化验证项目),我介绍完了两位沉默了一会问我什么是微内核? 二位是科班嘛?还奇怪研一成绩评定的奖学金为啥研二才申请到???(研一结束成绩出不来咋评?)全程给我的感觉就是非科班的本科生转码了来了南瑞,除了问一些c++,Python相关的八股文,剩下的问题显得非常业余…
1.问了我项目的问题,spark整合kafka这阶段做了什么事? 答:jdbc工具类向mysql表中插入数据,产生binlog日志文件,maxwell捕获到,kafka进行消费,然后javaapi上面编写kafka工具类,获取主题,编写配置信息,get到消费的内容,是JSON格式,转换json格式为row,然后转换为dataframe表,使用sparksql处理。 2.kafka的acks值有了解
面试官压迫感太强了,问题一个接着一个。 1.自我介绍 2.介绍实习经历 3.介绍一下你们数仓5层的用途 4.dwd详细做的事情 5.分区会产生小文件吗?怎么处理的? 6.你们的分区字段都是什么? 7.你们那边不做数据清洗的吗?在哪做,做了哪些东西? 8.清洗:废弃的字段是怎么去除的? 9.你怎么知道这个字段已经去除啦?为什么不在ods层的时候就去除呢? 10.订单id为null,就筛掉,那它不会丢
1. 接口和抽象类的区别 2. final关键字 3. flink checkpoint 4. checkpoint 中barrier的两种对齐 5. inteval join 6. 窗口函数 Sliding Time Window 为什么不设置很长的窗口时间 7. checkpoint 和 kafka offset的关联 8. offset的提交是自己写还是用flink框架 9. 非Barrie
总行信息技术数据研发 就10min! 1.深挖过往经历 2.用过数据库 or python吗 3.delete 和drop区别 4.找出字段中重复项 (这题好像答错了 搞成去重了😭) #杭州银行# #杭州银行面试# #数据人的面试交流地#
1.自我介绍 2.数据仓库分层 3.介绍项目 分工 难点 数分和数挖哪部分做的多 4.三范式 5.事务基本特性 6.存储和函数有什么区别(没懂) 7.为什么来杭州 8.反问
面试战况为4对1拷打,虽然没有手撕,但鼠鼠受到了终极八股+项目拷打 上来自我介绍+项目 讲10min Sql相关:mvcc,事务,索引。Sql的限制(啥东西)查一个表索引重复怎么办? 给题说思路:包括连接,开窗,去重,等等各种,explain,sql优化, Binlog,undolog,redolog(这部分答的还行) Linux:蚌埠住了,不该说会linux的 改用户名,找一个文本具体某行,修改
双非鼠鼠太难了, 投了差不多两个月了就一两个面试还寄了,还是回家摆摊卖手打柠檬茶吧 具体时间线忘了,三面后两周没消息后挂了。 ## 一面 1. 自我介绍 2. 实习经历和项目介绍 遇到最大的难点等 3. sql优化细说 4. 如果给你个全新的需求,你完全不了解,你会怎么做? 5. 如果你是数据团队负责人,你会怎么让实习生快速上手项目 6. 数仓模型分层介绍(数仓理论) 7. 浏览器打开网页涉及哪些
面试时间:20min 自我介绍 聊项目,实习工作。东问问,西问问,都不是很深入,就是聊天 手撕代码,从力扣上随便找的一道链表的题 场景题:排列组合怎么设计,大量数据找TopN,怎么设计一个压缩算法 反问:面试表现,工作内容 面试官依旧没开摄像头,似乎很忙,中间有人还找他。今天看状态还是业务复试,不知道挂没挂。
1 . 自我介绍 2.面试官,你们有教过大数据技术吗?应该没教过吧? 2.spark为什么比MapReduce快 3.spark算子链 4.问项目 5.Sql调优 6数据倾斜 6.一道sql题,思路,之前笔试做过,但只过了2/3 7.有接触过flink实时计算框架吗? 8.MySQL索引是越多越好吗?索引类型?什么时候用聚簇索引,什么时候用非聚簇索引 9.反问。 面试官挺好的,是我太菜了,一些没答
一面9.18 主要是Java八股,然后Redis,MySQL,kafka,zookeeper,hive hadoop (具体的问题忘了,天天实习+准备中期实在记不住了) 算法快排 二面9.19 主要围绕实习项目展开讲述,算法链表头尾依次连接 ,第一个头连最后一个,最后一个连第二个,第二个连倒数第二个.... 9.20hr面+oc
因为来学校宣讲,直接打电话让去面试,笔试也没参加;听完宣讲会后直接面试,因为宣讲会开得比较久,怕太晚结束不了,每次面三个,所有的科技岗都是一个面试官,这个面试官经历挺丰富的,我这组数分和研发的他都能问不少问题; 首先是三个人每个轮着自我介绍,接着就主要问简历,没啥技术问题,我是主要问了我项目,数学建模建的啥,具体是干啥的,遇到了什么问题,收货有什么;然后问为什么选择银行;每个人都是差不多10分钟,
自我介绍 数仓分层 为什么分层 为什么建模 星型模型,雪花模型 数据库的三范式 范式建模和维度建模的区别,优缺点 如果给你一个任务,一个月完成,你怎么规划 反问 oc
1、计算机网络: (1) TCP的三次握手和挥手 (2)OSI7层模型,每层分别有什么作用 (3)对哪个层的了解比较多一些,平时用得最多是哪一层 (4)传输层的协议有哪些 (5)是否对ip协议有了解,ip协议的分类等 2、数据结构 (1)数据结构的分类 (2)红黑树、平衡二叉树查找的过程、原理 (3)hash,hash冲突,解决hash冲突时单链表长度过长的问题 (4)大小堆 3、算法 (1)堆排
1.自我介绍 2.印象深刻的事 3.经历提问(技术细节) 4.数据分析的理解 4.数据分析的角度解释幸存者偏差(懵逼) 5.指标异动 6.反问