一面 电话面 40分钟 自我介绍 介绍实时数仓的项目 你这里用到了clickhouse,clickhouse的写入和读取为什么快 flink有哪些算子 flink的窗口函数了解吗 flink的精准一次性如何保证的 kafka是如何保证数据不丢失和不重复的,从生产者和消费者考虑 hbase用过吗,rowkey的设计原则是什么 如何解决热点现象 redis的数据结构了解吗 java的spring会吗
一面 spark数据倾斜 实习相关 二面 Sql 找出最长连续子序列(row_number) 算法 二叉树层序遍历 mapreduce运行过程 spark.shuffle.partitions的调参原理 Spark小文件参数 怎么确定reduce的数量 bucket join优化的原理 怎么快速根据spark stage找到对应的代码 主题域划分 事实表怎么建模 数仓建模过程 事务的特性 进程和线
等的心慌,写面经攒人品 9.15一面(25分钟,纯八股) 问实习的项目 研究生科研项目 疯狂hive,hive调优 一直问联邦学习,问了两遍 等了很久很久才二面,中间还收到了安抚短信。 ———————————————————————————— 9.26二面(30分钟,纯八股) hdfs读写流程 spark算子 spark调优 数据倾斜 对荣耀有什么想了解的(了解到我面试的部门是产品线云服务) 这个
个人情况:本双一流硕211非科班,一段搞深度学习的实习。项目自己做的。全程面试被追问麻了面试官有问题必追问 自我介绍 项目深挖(20min) 实习工作介绍(5min) 数据倾斜有哪几种解决方法 Group by 倾斜,join倾斜,null值倾斜 分别说说这些倾斜怎么解决:全说上来了,面试官问:还有呢?。。。开启负载均衡,对小文件进行合并,对数据类型进行检查,还有呢?我就记得这些了 Hdfs小文件
部门:优选事业部-美团买菜 timeline: 8.24 一面 8.28二面 8.31 hr面 9.7 oc 一面: 项目介绍 什么是指标体系 指标体系包含元素 指标分类 数仓分层、分层好处 数仓分层和指标分类之间有什么关系 什么是总线矩阵 什么样的数仓是一个比较好的数仓 什么方法可以落实上面说的数仓 缓慢变化维;除了拉链表还有哪些方式 什么情况下可以使用map join 怎么解决数据倾斜问题 J
1、4.3 线上一面 55 min 问题 python浅拷贝和深拷贝 django的生命周期 进程和线程的区别 知道哪些设计模式 分布式系统中的单例任务是怎么实现的 如何保证分布式锁唯一,在不适用存储中间件的情况秀下如何实现分布式锁 pg与mysql的区别有哪些 如何优化慢查询语句 快速排序的时间复杂度 写题 给定一个python字典,如何实现key, 和value的转换 这里我一开始给了一个字典
一面 1、自我介绍 2、询问本科、研究生的专业背景、技能学习、数据分析相关知识 3、询问sql、python、java等掌握情况 4、对数据支持的理解 5、深挖简历-重点:数据可视化分析维度、词云分析的重点、 6、深挖项目经历-重点:会不断挖掘你的语言漏洞,自己要能够圆回来 7、面试官针对实习经历还提出了好几个建议意见 8、逻辑题:一根不均匀的绳子,烧完是一个小时,如何判断半小时(微软算法面试题)
介绍自己,介绍项目 实习公司数仓的分层,优缺点 实习期间遇到的困难,解决方案 维度建模的流程 怎么理解数仓是反应历史变化的集合的 实习时用的是什么任务调度工具 结合谷歌的三篇论文谈谈对Hadoop的理解 对YARN的理解 了解实时吗 反问,无手撕
做个记录 基本上问项目,根据简历项目和实习的技术点衍生去问的 写面经攒人品~ 1.自我介绍 2.数据仓库的分层,以及为什么要做数据仓库 3.数据仓库的血缘关系 4.拉链表的实现 5.hive的压缩格式和存储格式 6.星型模型和雪花模型优缺点 7.spark和hadoop的区别 8.spark数据倾斜发生原因及解决方案 9.spark的新特性AQE和DPP 10.kafaka的特性 11.kafak
三一重工笔试大家都说挺简单的,还是提前批,所以最近也没抽时间来复习,直接上来裸考。 题目全是选择题,有三十道单选题,十道多选题。笔试限时一小时做完,实际上不到十分钟大部分就选完了。以下凭记忆记录几个题目,当然我也很多没做对~ 算是查缺补漏了。 1. hadoop 环形缓冲区大小? 2. spark 行动算子和转换算子识别? 参考链接: https://blog.csdn.net/weixin_
面试官讲了下工作有研发也有工程落地,所以后面问的关于开发的东西多一些。 1. 数据结构,有序二叉树插入的时间复杂度,数组插入的时间复杂度 2. 两个数组(集合),如何比较是否相同。一开始说要排序,后面想着遍历一下用哈希表存一下,再遍历哈希表应该可以。 3. c++的题,sizeof() 4. 如何判断浮点数等于0,我说abs(f) < epsilon。 5. 关于补码,为什么要使用补码 6. 面向
11.3 一面 1.自我介绍 2.实习时间 3.实习内容 4.学习中遇到的难题 5.最大的收获 6.实习中发现的问题,如何发现问题,解决的效果 7.Union和union all 的区别 8.索引介绍? 9.表经常被修改对索引具体有什么影响 10.公司业务部门规模 11.实习中做需求的速度 12.实习中遇到的问题 13.遇到不好沟通的人怎么办 14.上面派你监督你不负责的任务的做法 15.六级分数
TimeLine:一面20221115(已挂) BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师 写在前面的话:北京移动的面试环节紧凑,面试时间5-6分钟,问的问题都比较常规 一面 1. 毕业时间在什么时候? 2. 在北京移动公司是否有直系亲属? 3. 对于北京户口是否有刚需? 4. 你的年薪预期是多少? 5. 有没有投北京移动的其他岗位? 6. 是否愿意接受调剂到市场/综
1.hashmap底层数据结构 2.virtual的使用场景,虚函数表 3.设计模式 4.多线程同步的方法 5.三次握手 6.智能指针有哪些,如何设计一个share_ptr? 7. vector是如何实现的,和list相比有何优缺点? 8.想问我网络编程方面的,我说不熟悉,跳过了…… 9.c++ 源文件到可执行文件的过程 9.多线程适用于那些应用场景? 10.stl哪些容器是线程安全的 11.补充
全程15分钟,5位面试官,小姐姐挺好看的,嘻嘻嘻! 1、自我介绍 2、问我项目中springcloud中使用的组件 3、问我如何使用nacos和gateway 4、问我如果出现400怎么回事 5、问我另一个项目中redis的定位 6、如何在项目中使用redis的以及相关场景 7、小姐姐问意向地方和目前有那几个offer 完事! #联通数科##Java开发#