9.22 一面 1h 自我感觉挺好的还,9.26挂了 1)自我介绍 2)两个项目介绍 3)Hadoop的元数据存在哪里? 4)什么是缓慢变化维?拉链表的数据具体是怎么更新?并举例 5)Kafka的零拷贝机制? 6)对RDD的了解 7)哪些情况下会发生索引失效? 手撕代码 1)无重复字符的最长子串 双指针+map 2) 求出数组中最小的n个数 3) 求出每个部门的薪资前三的用
自我介绍 问对hadoop各个组件的了解 解释下mapreduce的过程 问有没看过谷歌的GFS论文 问项目里数据库咋建模设计的 对维度建模的了解 对数仓的了解,数仓一般咋分层 GGGG,这之前只关注框架底层了,,没看过数仓的东西#大数据开发面经##实习生[话题]##access#
首先做了三道SQL题,主要涉及分组聚合、窗口函数。 3.3 一面 28min: 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min: 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran
总共33min,凉透了,可能因为我是第一次面试,没经验,被面试官牵着鼻子走 1、数据仓库和数据库的区别 2、数仓的分层 3、维度建模的基本构成 4、了解缓慢变化维吗 5、说一下拉链表 6、用到了哪些用户指标作为算法的输入呢? 7、协同过滤的常用算法有了解吗? 8、Presto和Hive区别 9、Hivesql和sparksql区别 10、Sql:统计最近下单的用户是在去年12月份的用户数量 11、
#国企#一面 约37min 1. 介绍一下项目 2. MongoDB分布式存储是怎么做的? - 数据分片是怎么做的? - 如何保证节点间数据的一致性? - 如果有节点挂掉会怎么办? 1. 地理数据如何索引? 2. 喜欢用什么开发语言? 二面 约40-50min - 自我介绍 - 问了一些奖学金的情况 - 介绍项目经历 - 对分布式事务了解吗?解释一下分布式事务是做什么的 - 如何保证分布式事务的原
秋招第一个意向 感恩团子! 二面和hr面感觉自己发挥得并不是很好,一度以为凉了... timeline: 两次笔试都a四道多一丁点。 8.29 一面 8.31 二面 9.5 hr面 9.7 意向 一面 60min: jvm了解哪些 垃圾回收了解哪些 主线程和另外十个线程,怎样使主线程最后执行完毕 (join、await) flink checkpoint kafka有序和不丢如何保证 算法题 链表
1、自我介绍 2、实习经历介绍 3、实习项目难点介绍 4、你比别人的优势是什么 5、hive相比与传统数据库的优势是什么 6、hive集成了mapreduce,如何将hive语句转换为mapreduce 7、hive on spark和spark on hive的区别 8、spark调优你做过哪些? 9、数据倾斜调参和不调参的方法你知道有哪些 10、数仓的存储介质有哪些 11、数仓建模的话你会如何
110分钟,全程无项目和算法,全是八股深挖,被拷打惨了 1、谈一谈你对java面向对象的理解,什么时候用接口,什么时候用抽象类,从本质上讲一下区别? 2、都有了解过哪些设计模式?创建对象的设计模式有哪些?工厂模式和建造者模式分别在什么场景下使用,举一个具体的例子 3、java的hashmap在1.8之前链表中采用的头插法的方式,为什么1.8之后改成尾插法?头插法的方式可能会极限情况连成一个环,举一
开局自我介绍,然后问我两段实习经历,分别做了什么?照实回答,问我有没有接触过BI工具,我说是内部封装好的;日常工作,处理的数仓规模,人员规模,主要负责内容,处理的数据的大小。之后让我写一道题目,求连续三天消费金额大于100的用户ID,不想用排序函数再写了所以用了LAG函数来写,面试官给了我一个不置可否的表情(坏了可能写错了......)然后说我明白你的思路了,我解释说因为不想用排序函数来写所以尝试
投递岗位:大数据开发工程师(广州) 时间线:9.5投递,9.13技术一面,9.17技术+hr二面,9.19测评,10.7 意向 JD如下,岗位偏数据平台建设,非数仓 面经 技术 自我介绍 项目中最大的收获是什么,数据治理讲一下 hive分区表怎么创建(具体到关键字),分区的好处,怎么设计分区 hive分桶表怎么创建(具体到关键字),分桶的好处 hive外部表建表语句 (具体到关键字) hive s
一面(11/3) 自我介绍 拷打项目 然后问了一个Flink反压的问题 二面(11/10) 自我介绍 拷打项目 问了前端展示大量数据,如何考虑?(可能大佬就是前端的) 问了用了哪些数据库? 问了Kafka 和 Flume 的应用场景? (可能时间比较紧张,所以问的比较急,二面没有遇到反问环节了)
#互联网公司爆料# 58笔试通过但面试没有过,面试我的人首先问的还是数仓建模,我当时这方面还是刚学,不是很懂,问的建模细节还是不会,直接挂了,但整体还是可以的,薪资估计16起步吧,双非本科估计就是最低的白菜价
Java的设计模式 100g的数据在小内存里如何排序(spark) Spark为什么比mr快 Hbase的适用场景 Hbase为什么快 和Clickhouse一样的数据库 Clickhouse底层数据结构 Clickhouse为什么快(很细) 两个sql(难度较大) Hadoop的高可用触发后,会发生什么(面试官说不要背八股,详细说里面的流程) Flink水位线 激活函数有哪些(sigmoid,r
timelime 9.5投递 9.13一面 9.17二面 9.19测评 10.7 21:00 收到意向邮件。 ---------------------------------------------- 防定位,面经先匿了。 #晒一晒我的offer##天翼云##大数据##秋招##国企#
30min 自我介绍 项目: 介绍一下项目 几层。每层干了什么。去掉一层可以吗(又来) dwd和dws和ads都可以去掉 balabala 数据量 千万级别数据怎么同步? 业务datex+maxwell,行为 直接flume拉。 多久同步一次? 一天一次。 Ads层怎么接到可视化看板? 手拉(这边傻逼了,忘记说接clickhouse同步然后接到可视化软件上了) Zk在kafka里的作用? 保留of