(被捞起来重新面) 总共40min 手写模板方法,责任链模式(项目中的) spark和mr有什么区别,为什么spark比mr快 磁盘和内存 有有向无环图的这些优化 什么更优秀呢,什么原因导致比mr更快(不知道) spark里面,checkpoint和cache有什么区别,分别用于什么场景(场景完全忘记了) 数仓是怎么分层的 什么是业务过程(不知道) 事实表设计的步奏是什么(不知道) 三范式建模和维
为啥官网上写着java 数据库,结果面试全问我C++,这几天看的数据库都没问啥 30min 1. 自我介绍 2. 说一下Linux和常用命令,线程和进程的区别 线程和进程的本质区别是什么 3. Linux如何查看是哪一个进程占用率指定端口 4. C++了解到什么程度 5. C++中的const和底层const 的区别 fun(int i) fun(const int i)有什么区别,编译器怎么看
日常实习 一面 7.31 1 自我介绍 2 格力实习项目介绍(深挖) 3 个人负责了哪个功能点 4 所做模型的衡量指标是什么 5 团队协作情况 6 字节实习工作内容、考核指标 7 sql 查询语句执行顺序 8 窗口函数 9反问 二面8.2 1 自我介绍 2 个人求职方向规划 3 为什么不投本专业对口岗位(我是物流本硕) 4 怎么考虑去的格力那边实习 5 所做项目具体介绍 6 讲述所做的算法框架 7
自我介绍 手撕,股票最大利润 sql 成绩排名三 数仓分层 数据倾斜 遇到的问题 为什么要分层 分析了哪些指标 介绍一下spark 介绍一下hadoop 介绍一下hbase 反问 不知道哪的问题,又凉了面了这么多0offer
云和数据 一面 0.笔试,全是选择题,简单 1.自我介绍,个人情况介绍。 2.mybatis一级缓存和二级缓存 3.spring的回滚异常 4.springboot的日志框架(sl4fj+logback,面试官说 不对,鼠鼠记得就是这个啊) 5.数据库索引失效 6.vue2的数据响应原理(mvvm) 7.你对实习薪资要求 8.个人规划 9.springbootapplication注解启动的理解
状态最不好的一次,面试官说话温温柔柔的我本来中午就没睡感觉快要睡着了 腾讯会议,对方没开摄像头(整个屏幕都是我的脸) 自我介绍 然后问了对数据开发的了解 数据建模、数据分层 然后就开始共享屏幕写sql(本来让我写hive sql,我说我不会) 三道题,写的稀碎... 主要是问题的逻辑我理解不了,再加上自己sql写的没那么熟练,在加上我真的好困啊 然后写完了 他就和我说,多练练sql,别搭虚拟机框架
update: 9.30 约 10 月中旬 HR 面了,许愿 OC 🤗 --- 9.29 字节四面,问了 HR 四面技术好像是这个部门的正常情况😅,I'm like, well... - 自我介绍 - 上来先做了一道题:Leetcode 解码方法(动态规划) - 实习具体负责哪些工作,占比是怎样的 - 你们数仓团队几个人,数仓怎么分层、分主题 - 分层的意义 - 你在商品域的工作中是否会涉及边
9.12 一面结束后半小时飞速约了二面,9.14 二面 - 自我介绍 - 为什么读研 - 为什么转专业 - 你对大数据的理解 - 介绍一下实习组内的分工、数仓架构 - 以商品域为例,数据的模型/表有哪些,从哪些角度评价数据模型 - 你们组具体的宏观的业务流程 - 具体是怎么和其他部门协作的,流程是怎么样 - 你是怎么理解数开的工作的,你个人的偏好是哪方向 - 数据库的范式、事务 - 范式建模、维度
这个是之前的,面了有20多天了吧(maybe)感觉日子过得好快,都没有什么offer入账,不知道大家现在如何?发一发攒攒人品吧,offer快快来 自我介绍 问及之前的实习相关经历 人生最难过的一个阶段,如何从泥潭里爬出来的? 对快手有什么了解? 如果遇到需要非常细致且不能出错的数据,你会怎么办? SQL相关问题: 聚合窗口函数和聚合函数的区别 常见的连接方式有哪些? 通配符有哪些? #非技术面试记
中秋假期所以二面三面间隔了挺久的,9.23 三面,面试时间很短,35 分钟左右 - 自我介绍 - 实习介绍 - 看你做了很多任务优化,讲讲优化的思路,从哪些方面去考虑 - 介绍一下 Cube 表去重优化 - 介绍一下***识别项目 - 你们商品维表数据量 - 你们实习部门的数仓分层 - 用户域和流量域的区别 - SQL:今天登录但昨天没登录的用户 - 算法:二叉树层序遍历,自己构造输入输出 - 你
#软件开发笔面经# 1、自我介绍 2、面试官:你倾向于数仓还是数开。我:实习做的数仓,所以更倾向于数仓。面试官:好的,我们是做后端开发相关的 3、说一下实习期间做的工作 4、介绍下你的第一个项目 5、了解过zookeeper吗 6、spark中dataframe和dataset的区别 7、简单说一下kafka是干什么的,消息能保证全局有序吗 8、了解容器吗,docker和kubernetes 9、
Gaussdb是什么数据库 Gaussdb和Doris有什么区别 数据湖和数据仓库有什么区别 hudi中你们用的哪种表类型 hudi怎么实现实时数据更新的 HIVE有哪些模块 知道HIVE的thrift吗,有什么好处 生产中是用哪种方式连接HIVE的,会用jdbc连接吗 知道哪些spark的运行模式 yarn-client和yarn-cluster的区别是什么,从中选一个运行模式具体介绍下 sel
1.挖项目 2.jvm垃圾回收 3.找问题,String类型循环内使用+= 4.mysql 聚簇索引和非聚簇索引 5.hashmap原理 6.索引数据结构(b+树),特点 7.hive数据倾斜 8.hive mapjoin ,bucket map join ,SMB join 9.flink watermark 10.flink checkpoint. 三种分布式快照算法 11.flink 状态
1.自我介绍、成绩排名、读研计划、奖学金、是否挂科、有无数模竞赛经历 2.介绍项目,数仓设计中主要考虑的点 3.开发用的语言 4.项目数据量多少,报表用什么软件做的 5.实习工作介绍,dqc怎么用的 6.实习最难的一点是什么 7.机器学习和深度学习了解吗 8.python常用的包 9.rdd和dataframe和dataset的区别 10.hive查询过程怎么优化 11.你的性格在工作中的优势 总
做个记录 基本上问项目,根据简历项目和实习的技术点衍生去问的 写面经攒人品~ 1.自我介绍 2.数据仓库的分层,以及为什么要做数据仓库 3.数据仓库的血缘关系 4.拉链表的实现 5.hive的压缩格式和存储格式 6.星型模型和雪花模型优缺点 7.spark和hadoop的区别 8.spark数据倾斜发生原因及解决方案 9.spark的新特性AQE和DPP 10.kafaka的特性 11.kafak