2022-07-22 时长1h 1 自我介绍 2 数仓项目数据量多大 3 几个shell问题,监控spark日志内容并写入到另一个文件、实时监控spark日志内容 4 Java关键字、面向对象三大特征、接口和抽象类区别 5 set list map区别 6 介绍JVM内存区域,String是基本数据类型吗?基本数据类型变量存在哪里 7 垃圾回收机制 8 新生代老年代对象是如何流转的 9 创建线程的
2022-07-27 下午 时长1h5min 百度的面试官真的很好,这点没得说 1 自我介绍 2 数据倾斜——结合业务说了分组聚合和join,大表大表join怎么解决数据倾斜,展开说 3 SQL 没做出来,但是面试官全程提示,沟通交流 4 Hive和Spark哪个比较熟悉,我们聊一聊——都比较熟悉,问了Hive组件和底层执行逻辑,逻辑计划优化有哪些方法,什么是谓词下推(自己提到了) 5 算法:数组
问题如下,50min左右 自我介绍 为什么要找互联网而不是研究方向 项目介绍,主要负责内容 整体框架怎么去搭、团队如何分工、沟通 shiro、Spring security区别(优缺点,选择其中一个的理由),查资料后,有没有自己写demo验证 shiro比security使用方便具体的点,举开发例子 Docker怎么部署,如何资源分配,怎么分配 运行的远程服务报错,本地无法复现,怎么排查问题 有没
1h 面试官没开摄像头,然后我也没开~ 1. 自我介绍 2. 项目介绍 3. Java NIO原理,与BIO有什么区别 4. 线程不安全的类有哪些 4. G1回收器原理 4. 类加载过程 4. GCROOTS由什么组成 5. 数据库索引 6. 数据库的事务和一致性 7. 计网分层结构 8. TCP和UDP的区别 9. TCP怎么实现可靠传输 10. HTTP3.0展开讲讲 11. 进程和线程的区别
28min 一位很友好的大哥,感觉问的比较简单全程没有怼我,希望不是KPI面😓 一面 开问: 自我介绍? 介绍Spark 项目? 介绍数据仓库项目,怎么建模怎么分层的? 数仓分层的优点在哪里? 项目里面提到了留存率,你怎么计算留存率的? TCP说一说? TCP和UDP区别说一说? A 3条数据,B 4条数据 A left join B 结果会有几种情况? 双流join 讲一讲? 缓存过多你的解决
40min 1面 自我介绍 项目介绍 做题:一道算法, sql2道 数据库索引有什么用 索引失效的情况 spark提交作业的流程 spark 共享变量有哪些 广播变量怎么实现的 hive外部表和内部表区别 hive优化,项目中使用到了哪些,展开讲讲 kafka是读写分离 为什么不做读写分离 mysql事务 40min 2面 自我介绍 项目介绍 算法题(20min) hard plus 没写出来最优
面试官非常非常不专业,给人的感觉就是水货。 1. 自我介绍 2. 为什么没实习 3. 介绍社团经历 4. 介绍班干部经历 5. 反问 5.1 你的工作内容是什么,在工作之中遇到了哪些困难? 5.2 如果你和团队成员的想法出现了很大的分歧,你会如何处理? 5.3 你觉得宁德时代的社会责任感体现在哪? 5.4 接上,具体是怎么做的? 5.5 你觉得氢电池和目前电池相比优缺点是什么
9.26 一面 (10.12感谢信) 20min+ 自我介绍 项目介绍 介绍下数仓分层?做了哪些数据处理? Spark反压机制? HDFS读写流程? kafka中出现数据堆积如何处理?
一面 时间:具体时间忘记了,应该是上个月的事情,反正离今天好久了 内容: 1.自我介绍 2.问我纯数据分析技术岗和带点综合管理的岗位选哪个 然后就结束了······ 二面 时间:2022.10.17 内容: 1.自我介绍 2.家里在哪里?身高多少?学硕还是专硕? 3.毕设做的内容 4.跟我讨论了我的科研方向(我做的信息传播动力学的方向,能看出来这个面试官对我的方向是有一定了解的) 5. 问我参与了
估计自己凉了,没想到一面是技术面试,而且问得特别详细,首先:你先做个简单的自我介绍,然后在介绍一下你觉得比较能讲的自己的项目。然后针对于我的项目细到了问我的cnn使用的哪一种核心架构,然后我回答不出来他提示我说是自己写的架构还是用的比较经典的。输入数据是几维,输出是几维,怎么输入的。然后问我用的激活函数是relu还什么,然后问我为什么用relu,问的深度学习里的东西特别细。因为我之前做的项目还有个
视频面,1h 吐槽:我8.11投递的岗位...八月底做完的笔试....10.21给我发邮箱约面,也不知道前面是哪个大佬拒了offer然后把我给捞上来了 但是,面试官人很好啊~面试体验很好~ 虽然我很多没答上来只能说分治思想贯穿了全程... 无自我介绍 实习 由于我有数据开发相关的实习,所以前30min各种问实习 做了哪些工作,怎么做的,任务挂了怎么办,怎么做的清洗,用的啥语言,用的是啥架构/工具?
10.20 一面 25min 自我介绍 Hadoop三大组件介绍 MR Shuffle的过程? Spark shuffle和 MR Shuffle概念和区别? shuffle作用? shuffle中涉及到哪些排序?快排和归并排序时间复杂度是多少? 宽窄依赖概念,如何划分? 一亿条数据如何找出top100? 归并排序 未来职业规划? 反问
hive的架构 hive外部表和内部表的区别 内部表的数据由hive管理,且存储在hive.metastore.warehouse.dir配置下的路径中;外部表的数据由HDFS存储,路径可以自己指定; 删除表时,内部表会把元数据及真实数据删除;外部表不删除真实数据。 你用过hive哪些窗口函数 可参考:面试官:你用过哪些窗口函数 一般用什么文件格式 可参考:面试官:“你们实际生产中hive用什么文
1-4面为春招实习,很遗憾最终没有通过,5-8面为秋招投递同一个部门,hr面后通知说换了一个组加一轮技术面和hr面,总体来讲实习面试更侧重实验室项目,秋招面试会细聊实习工作,每一轮的面试官都很nice,也都是一次很好的学习经历,感恩这一年和蚂蚁的相遇~ 一面(技术面) 介绍项目 遇到了什么问题 怎么解决的 介绍一下大数据的发展历程 项目选型,为什么用这些组件 介绍另一个项目 除了准确率还用了什么指
首先肯定是惯例,先自我介绍。 Golang 因为是大数据岗位,所以面试官本身也不是那么精通go,所以问的比较水。 谈谈指针是啥,出现的意义? init函数和main函数的区别和联系 用过struct中的tag吗?谈谈这是啥? 计算机网络 tcp协议在哪一层?http呢? 数据结构 谈谈线性表是什么? 那么数组和链表的区别呢? 你上面说了时间复杂度这个概念,那么什么是时间复杂度?o(1)和o(n)的