35min 1面 自我介绍 排序算法知道哪些 稳定的排序算法有哪几种 mr和spark的区别 bitmap解释一下 bitmap用途有哪些 布隆过滤器的原理 一道dp题,口述思路没想出来。。。 三道业务场景题 30min hr面 常规hr面 vivo流程真快,爱了,九月底开奖 #大数据开发##大数据开发工程师#
1、自我介绍 2、数据仓库为什么要分层,目的是什么 3、DWS层和DWT层是怎样划分的 4、PV和UV分别是什么 5、数据仓库建模的两种形式 6、范式建模中的第三范式的原则 7、维度建模中最常见的建模形式是什么区别是什么 8、如何评判数仓的优劣性 9、MR流程是写的MR程序,还是通过hql 10、用户留存率的计算公式 11、HDFS的写流程 12、MR的底层原理 13、MR
#数据人的面试交流地# 今年找实习和秋招都很难,很多公司投了都不理,在这里记录一下自己面过的一些公司面经,顺便拿个奖励 2023届实习面经:音泰思(大数据开发实习生) 好像是个对日外包公司,这是我的第一次面试,第一次就体验到了10分钟的面试 下边是面试内容: 2022/03/15 一面: 自我介绍 介绍下项目 jvm垃圾回收机制 为什么要用kafka mr flume断点续传 2022/03/15
#数据人的面试交流地# 第二次实习面试 巨杉数据库 一面 数据库应用开发工程师 2022/03/17 常用的容器,Arraylist hashmap的区别 iolist和listnext(这个可能听错了,当时没听懂是什么) 数组、链表、栈、队列的不同 tcp udp 流量控制 进程和线程 mysql了解啥,说一下高并发 项目 hive sql 用过哪些优化 MVCC用来干嘛 进程间通信的方式 Li
#数据人的面试交流地# 十方融海 大数据开发实习生(秋招提前批) 一面:2022/05/30 自我介绍 this super 值和引用 垃圾回收算法 多线程用过吗 回收算法 进程线程 Linux子系统: linux内核的子系统有5个: 1、 进程调度控制系统(SCHED); 2、内存管理系统(MM),主要作用是控制多个进程安全地共享主内存区域; 3、虚拟文件系统(VFS); 4、网络接口(NET)
一面 1、自我介绍 2、先问实习内容,实习涉及了实时数仓,细问了一些点 3、再问项目内容,做的是离线数仓 4、离线数仓的数据源有哪些?是怎么收集这些数据的? 5、离线数仓是怎么分层的?分层依据是什么? 6、JVM的内存模型介绍一下 7、说一下你知道的垃圾回收算法 8、MySQL的存储引擎有哪些? 9、做过哪些HiveSQL优化?或者说你了解哪些优化措施? 10、怎么解决数据倾斜问题? 11、有接触
#数据人的面试交流地# 广州丰石科技 大数据开发实习生 2022/06/07 一面:感觉就是kpi 进去之后做一份面试题,hr叫我做小题,后边的大题不需要做,做完之后面试的时候给面试官看,第一句就是后面的题不会做吗? 蚌埠住了。。。 自我介绍 spark中数据迟到怎么处理 hive权限管理 cdh kafka分区策略 sparkstream对接kafka的方式, hashmap键和值允许为空吗,
#数据人的面试交流地# 赫基集团 大数据开发实习生 一面:电话面 2022/06/21 1.sql判断是否有重复数据 2.数据库引擎的区别 3.说一下项目 4.项目中转化率数据异常怎么进行清除 二面:主管加hr面 2022/06/31 项目和经历 建模(雪花模型和星型模型) 渐变字段 笛卡尔积用在什么场景?没想出来,最后面试官说这是个坑,说没人愿意遇见笛卡尔积 还有普遍hr问题 反问 科大讯飞 A
#数据人的面试交流地# 中数通 数据岗 2022/11/02 毕设做好了吗,方向是什么 什么是大数据 用过的存储工具 Hadoop和hive的区别 用过的采集工具采集 数据的过滤是怎么做的,再flume定义的拦截器,json异常怎么进行处理 kafka是什么 用过的数据挖掘,体现再哪里 数据的展示 flume和spark分别是什么,什么时候采用 参加过的比赛 比赛中是如何完成,分工,时间,设计,流
#数据人的面试交流地# 2022/09/30 闻泰科技 大数据开发 一面: 为什么当程序员? 加班接受? 家人愿意让你去深圳发展吗? 职业规划 mysql: 索引了解吗 性别适合做索引吗,经常改变的字段适合做索引吗 MySQL的锁 事务的四大特性 事务内增删查改的语句是按顺序执行的吗 视图是什么 数据是怎么存储的 hive:hive在hdfs上的存储格式 怎么看hive表的存储路径 show ta
#互联网公司爆料# 这个公司我是参加的校招,当时面试我的估计是一个组长,问了大数据SQL,以及spark,对于SQL我轻松秒杀,spark当时也学习了没啥压力,面了20分钟直接通过后面是一个技术负责人面我,问了一下hive,MapReduce,Java集合,也是直接通过,感觉技术不难,最后HRBP直接来面我,也是直接过,后面就是直接发offer,薪资真的不高,就11k,13薪吧,我感觉不高直接拒绝
一面 50分钟 自我介绍 http协议是哪一层的协议,讲一下对http的了解 tcp协议和udp协议是哪一层的协议,讲一下他们之间的区别,以及他们各自的应用场景 你知道get和post请求吗,讲一下他们之间的区别 当我们输入美团网址的时候,这个从输入到显示页面的过程 你了解操作系统吗,linux了解吧,你说一下你用过的命令 当我们要查看文件的具体属性用什么命令 讲一下静态链表和动态链表的区别 数据
一面 电话面 40分钟 自我介绍 介绍实时数仓的项目 你这里用到了clickhouse,clickhouse的写入和读取为什么快 flink有哪些算子 flink的窗口函数了解吗 flink的精准一次性如何保证的 kafka是如何保证数据不丢失和不重复的,从生产者和消费者考虑 hbase用过吗,rowkey的设计原则是什么 如何解决热点现象 redis的数据结构了解吗 java的spring会吗
1.平常是用python还是java?python和java掌握程度? 2.hadoop的组成,每部分有什么用。 3.spark掌握的怎么样,SQL练过哪些题。 4.mapreduce源码看过吗? 5.wordcount的流程。 6.Scala有没有学过? 然后开始挖简历,还问了我一些业务的问题。 说后面会通知二面,也不知道有没有...
Spark 出问题如何排查 Spark 分区和hdfs block的关系 10000个小文件场景,spark是调整内存配置参数还是调整并行度参数 Spark sql 底层原理 Spark sql如何优化 Hbase region的分裂 #美团#