大致是下面这些问题(顺序不记得了) 1 自我介绍 2 软件测试方法 3 微信发红包设计测试用例 4 mysql数据库基本命令 5 linux命令常用哪些 6 Python了解哪些;Python有哪些数据类型;Java了解哪些?数据库 Tomcat连接的过程是什么 ? 1-100里面能被3整除的数有哪些?不限制语言,可以写出代码吗? 7 接口测试了解哪些 8 如何判断前端问题还是后端问题 9 如果
0:自我介绍必不可少的 1:数仓的数据从哪里来的?多少数据? 2:数仓分层 3:DWD层如何保证和ODS层的一样的数据粒度,如何提供数据质量保证? 4:什么阶段进行数据清洗? 5:数据量很大的时候每层都进行数据清洗吗?如何解决 6:ETL过程中,数据出现问题了如何预警? 7:团队合作的时候如何保证数仓分层的规范? 8:Hive的调优(项目写到了这个) 9:什么是zookeeper? 10:zook
30左右的一位前辈 25min 自我介绍 为什么选择大数据这个方向 从想要计算的效果,各方面使用的组件,还有最后的结果来介绍下项目 为什么用ES 项目难点说一下 说一下你是怎么理解Spark 的 说一下Java 多线程 Java 讲一下锁机制,说一下读写锁的实现原理 JVM 垃圾回收机制讲一下 反问 业务场景? 主要的难点? #海康威视##大数据开发工程师#
30min 自我介绍 项目介绍 项目难点介绍 hadoop组件有哪些 hdfs简单介绍 hdfs怎么实现高可用,具体 是哪个进程在zk上注册临时节点 hdfs怎么防止脑裂 hdfs写流程,写到一半client发生OOM之后该怎么办,datanode宕机怎么办 怎么实现nn切换,而客户端无感的 Spark提交作业的流程 Executor内存管理,分别存储什么 spark shuffle有哪些,讲一下
35min 1面 自我介绍 排序算法知道哪些 稳定的排序算法有哪几种 mr和spark的区别 bitmap解释一下 bitmap用途有哪些 布隆过滤器的原理 一道dp题,口述思路没想出来。。。 三道业务场景题 30min hr面 常规hr面 vivo流程真快,爱了,九月底开奖 #大数据开发##大数据开发工程师#
1、自我介绍 2、数据仓库为什么要分层,目的是什么 3、DWS层和DWT层是怎样划分的 4、PV和UV分别是什么 5、数据仓库建模的两种形式 6、范式建模中的第三范式的原则 7、维度建模中最常见的建模形式是什么区别是什么 8、如何评判数仓的优劣性 9、MR流程是写的MR程序,还是通过hql 10、用户留存率的计算公式 11、HDFS的写流程 12、MR的底层原理 13、MR
#数据人的面试交流地# 今年找实习和秋招都很难,很多公司投了都不理,在这里记录一下自己面过的一些公司面经,顺便拿个奖励 2023届实习面经:音泰思(大数据开发实习生) 好像是个对日外包公司,这是我的第一次面试,第一次就体验到了10分钟的面试 下边是面试内容: 2022/03/15 一面: 自我介绍 介绍下项目 jvm垃圾回收机制 为什么要用kafka mr flume断点续传 2022/03/15
#数据人的面试交流地# 第二次实习面试 巨杉数据库 一面 数据库应用开发工程师 2022/03/17 常用的容器,Arraylist hashmap的区别 iolist和listnext(这个可能听错了,当时没听懂是什么) 数组、链表、栈、队列的不同 tcp udp 流量控制 进程和线程 mysql了解啥,说一下高并发 项目 hive sql 用过哪些优化 MVCC用来干嘛 进程间通信的方式 Li
#数据人的面试交流地# 十方融海 大数据开发实习生(秋招提前批) 一面:2022/05/30 自我介绍 this super 值和引用 垃圾回收算法 多线程用过吗 回收算法 进程线程 Linux子系统: linux内核的子系统有5个: 1、 进程调度控制系统(SCHED); 2、内存管理系统(MM),主要作用是控制多个进程安全地共享主内存区域; 3、虚拟文件系统(VFS); 4、网络接口(NET)
一面 1、自我介绍 2、先问实习内容,实习涉及了实时数仓,细问了一些点 3、再问项目内容,做的是离线数仓 4、离线数仓的数据源有哪些?是怎么收集这些数据的? 5、离线数仓是怎么分层的?分层依据是什么? 6、JVM的内存模型介绍一下 7、说一下你知道的垃圾回收算法 8、MySQL的存储引擎有哪些? 9、做过哪些HiveSQL优化?或者说你了解哪些优化措施? 10、怎么解决数据倾斜问题? 11、有接触
#数据人的面试交流地# 广州丰石科技 大数据开发实习生 2022/06/07 一面:感觉就是kpi 进去之后做一份面试题,hr叫我做小题,后边的大题不需要做,做完之后面试的时候给面试官看,第一句就是后面的题不会做吗? 蚌埠住了。。。 自我介绍 spark中数据迟到怎么处理 hive权限管理 cdh kafka分区策略 sparkstream对接kafka的方式, hashmap键和值允许为空吗,
#数据人的面试交流地# 赫基集团 大数据开发实习生 一面:电话面 2022/06/21 1.sql判断是否有重复数据 2.数据库引擎的区别 3.说一下项目 4.项目中转化率数据异常怎么进行清除 二面:主管加hr面 2022/06/31 项目和经历 建模(雪花模型和星型模型) 渐变字段 笛卡尔积用在什么场景?没想出来,最后面试官说这是个坑,说没人愿意遇见笛卡尔积 还有普遍hr问题 反问 科大讯飞 A
#数据人的面试交流地# 中数通 数据岗 2022/11/02 毕设做好了吗,方向是什么 什么是大数据 用过的存储工具 Hadoop和hive的区别 用过的采集工具采集 数据的过滤是怎么做的,再flume定义的拦截器,json异常怎么进行处理 kafka是什么 用过的数据挖掘,体现再哪里 数据的展示 flume和spark分别是什么,什么时候采用 参加过的比赛 比赛中是如何完成,分工,时间,设计,流
#数据人的面试交流地# 2022/09/30 闻泰科技 大数据开发 一面: 为什么当程序员? 加班接受? 家人愿意让你去深圳发展吗? 职业规划 mysql: 索引了解吗 性别适合做索引吗,经常改变的字段适合做索引吗 MySQL的锁 事务的四大特性 事务内增删查改的语句是按顺序执行的吗 视图是什么 数据是怎么存储的 hive:hive在hdfs上的存储格式 怎么看hive表的存储路径 show ta
#互联网公司爆料# 这个公司我是参加的校招,当时面试我的估计是一个组长,问了大数据SQL,以及spark,对于SQL我轻松秒杀,spark当时也学习了没啥压力,面了20分钟直接通过后面是一个技术负责人面我,问了一下hive,MapReduce,Java集合,也是直接通过,感觉技术不难,最后HRBP直接来面我,也是直接过,后面就是直接发offer,薪资真的不高,就11k,13薪吧,我感觉不高直接拒绝