一面 8.9 30min 自我介绍 职业规划 维度建模方法有哪些 数仓理解 hive有哪些复合数据类型 hive与关型数据库有什么区别 hive数据倾斜 kafka高吞吐 flume有哪些类型的channel,如何选择 大规模用户下,实际业务进行中会有哪些难点,需要怎么解决 反问 面试官人挺nice,问的问题都耐心解释了 综合面 8.11 20min 没问技术,主要太菜了,跟hr面有点像 hr面
40min 面试官问的很细,来自数据平台,技术感觉很强很全面。 warm-up 自我介绍 有其他意向吗?能来北京吗 挑一个做得好的项目介绍下全流程 难点在哪,讲一下 ElasticSearch ES有用到集群吗?有设置分片吗?有设置副本吗?副本数是多少? 你是怎么建立索引的?为什么这么建立索引? Hive 离线处理有用过Spark 吗?没有,主要用的是Hive 说一下Hive 构造UDF 的过程?
30min 1. 自我介绍 2. 为什么走大数据 3. 项目介绍 4. hive和spark的区别 5. MR和spark有哪些区别,分别适用什么场景 6. 为什么不选择spark做离线 7. 开窗函数有哪些 8. 数仓怎么设计的 9. ODS层存在的意义 10. DWD和DIM怎么设计的,有什么指标 11. DWS层存放的哪些指标 12. 下一步准备学习什么?怎么学习? 反问 1. 部门做什么业
公司:好未来 岗位:数据开发工程师 形式:视频面试 视频面试平台:牛客 时长:30分钟 流程: 1、自我介绍。 2、说一个最拿手的项目经历。 3、了解阿里数仓OneData体系吗? 4、了解大数据相关的应用框架吗? 5、对SQL优化有了解吗? 6、说一下Hive的工作原理。 7、Hive有索引吗? 8、Hive的内部表和
开局自我介绍,然后问我两段实习经历,分别做了什么?照实回答,问我有没有接触过BI工具,我说是内部封装好的;日常工作,处理的数仓规模,人员规模,主要负责内容,处理的数据的大小。之后让我写一道题目,求连续三天消费金额大于100的用户ID,不想用排序函数再写了所以用了LAG函数来写,面试官给了我一个不置可否的表情(坏了可能写错了......)然后说我明白你的思路了,我解释说因为不想用排序函数来写所以尝试
投递岗位:大数据开发工程师(广州) 时间线:9.5投递,9.13技术一面,9.17技术+hr二面,9.19测评,10.7 意向 JD如下,岗位偏数据平台建设,非数仓 面经 技术 自我介绍 项目中最大的收获是什么,数据治理讲一下 hive分区表怎么创建(具体到关键字),分区的好处,怎么设计分区 hive分桶表怎么创建(具体到关键字),分桶的好处 hive外部表建表语句 (具体到关键字) hive s
两次面试邮件里都写的是初试,不清楚第二次面试属于二面,还是一面挂了被共享到别的部门了。 先说体验,两次的面试官都彬彬有礼,相对年长,可能是主管级别。问题由浅入深,从场景入手,通过思路的引导,了解你的知识掌握水平。 之前理解的数据开发可能更偏向数仓开发,但很多公司数据开发岗位的工作内容是大数据组件的性能优化、数据引擎开发、数据服务开发等等,所以对java开发中多线程编程、jvm等是有较高要求的,我个
1.自我介绍 2.一周能实习多少天 3.是否考研,为什么不考 4.linux基本操作 5.手撕SQL,没答上来。请求提示,有个函数没听说过。 6.在学习的时候哪里用到了SQL 7.MySQLDDL是否了解(太紧张突然想不起来DDL是啥了,就说了没有。。),结束那一刻我才反应过来,麻中麻。。 8.反问环节 hr挺和蔼的。但是我实在又紧张又菜。。估计是凉了。 过两天还有百度的面试,更是重量级,看到自己
HR面感觉挺好的不知道咋挂了 1、自我介绍 2、如何看待实习和学校学习 3、期望薪资 (感觉是这个问题,我答的是:该岗位一般是10k-15k,所以我觉得不能少于10k) 3、为什么来广州,为什么不在武汉找工作 4、手里有Offer 吗,不满意的点,(我答的薪资和公司文化) 5、抽取的问卷题,物业不让养狗,怎么看 今天看到消息,挂掉了,没搞懂为何挂了,自我感觉答得还不错,也不紧张 心里还好没有多大落
7.21 一面 1、自我介绍+聊天 2、八股文: (1)堆栈区别 (2)C++中参数传递的方式有哪些 (3)介绍下static关键字 (4)介绍下const关键字 (5)volatile关键字 (6)静态多态与动态多态 (7)写一个返回两个值中比较小的那个值的宏定义 (8)函数指针 (9)计算机体系结构包含哪些 3、编程题 给定一个数N,按行输出,第一行输出1、第二行输出2 3 第三行输出 4 5
问题内容: 这可能是一个非常琐碎的问题,但是我很难找到答案: 使用Google Eclipse插件,我想开发一个简单的旧Java应用程序(而不是Web应用程序),该应用程序使用AppEngine进行云存储。 为此,我当然可以简单地创建两个项目,一个包含AppEngine服务器,另一个包含Java应用程序。 但是我想知道是否有可能在Eclipse中设置一个包含服务器和客户端代码的单个项目(例如GWT
时间:2022年7月1日 面试职位:大数据开发工程师(留用实习生) 如题,留用实习生也就是平时说的暑期实习生,有转正机会的实习生 面试流程,自我介绍,什么时候能入职,学校的事情都已经忙完了吗, 我简单的说了一下情况然后第一问题: ①怎么平衡学校的课程,论文的研究工作,和找工作的时间安排 ②说一说自己的实习经历 ③看到我写电商数仓的项目,介绍一下电商数仓的项目。 前面的问题都回答的还好,但是这
【字节提前批-大数据开发工程师-Data 一面】 0 面试官自我介绍,介绍面试流程 有些奇怪的是 首先提到这个岗位不是xxx(记不清原话),偏向开发,询问是否能接受,当时我的理解是:可能这个岗位偏向大数据组件的开发,而我简历里没提及java,所以面试官想知道我是否还愿意继续面试该岗位? 随表示接受 1 自我介绍: 学校,专业,目前的实习单位和岗位,在校项目简述 2 对实习参与的项目的展开介绍:我实
45min 自我介绍 数仓项目的数据采集模块怎么做的 flume组成,各个模块的功能 为什么要使用这些source或者是sink file channel和memory channel有什么区别,分别在什么场景使用 flume内部原理 sink消费能力弱,channel会不会丢失数据 数千台机器需要采集日志小文件到hdfs上,该怎么办? 数千个flume要怎么统一配置,修改就分发吗? maxwel
问题: ·问了一下实习和项目 ·哪些数据库有跳表这个基础类型 ·c++类的缺省函数4个有哪些 ·new、delete、malloc、free区别 ·讲一下虚函数的作用 ·进程线程区别 ·介绍一下数据库事务ACID ·介绍一下数据隔离级别 ·讲一下hash索引和b+树索引 ·临时表了解吗 编程题: ************ (和去年的面经一样,我提前准备过) Q&A: 面试流程 对于HTAP的看法