一面 实习深挖 对于高耗时任务的代码优化思路 如何发现不必要的扫表 sparksql和hivesql有什么区别 sparksql和hive on spark性能有差异吗,差异在哪 hdfs架构 datanode心跳机制 datanode挂了之后会怎么样,容错机制是怎么样 机架感知 有限内存下的一亿数据怎么排序 了解哪些shell命令 有a,b两个文件,存的都是id,写shell找出a中有但b中没有
#23届找工作求助阵地# #实习# #网易智企# 一轮面试: 1.比赛相关(自动化敏感信息提取项目中:数据提取、清洗和转换是怎么做的?数据量大概有多少?最终的训练模型的数据结构是怎么样?有没有涉及到分布式集群来训练模型?) 2.课题相关(刚才说这个项目不是用到多卡多去存储,应该是相当于HDFS文件上面对吧?有没有用到它里面的一些计算的一些引擎,那你存储它的用它的组件的目的是什么?Hadoop的集群
一面 项目相关 说一说第三方登录涉及的设计模式 工厂模式有几种实现? AOP的实现原理 动态代理的使用场景 如何实现前缀树 对应MySQL的慢查询如何排查和优化 Linux如何实时查看日志输出 Docker compose是否使用过 聊天 反问#我的实习日记##我的实习求职记录#
一面 9.1 1. 自我介绍 2. go channel 底层 3. go 写 channel 的时候什么时候阻塞什么时候不阻塞 4. 函数传入 slice 作为参数的时候 函数内部的修改是否会影响外部的值 5. k8s 创建一个 pod 的过程 6. k8s 如何从外部访问集群内部的 pod 7. slice 底层 8. 虚拟内存怎么实现的 9. TCP 三握四挥 10. 算法题 从一个字符串变
一面 数据同步怎么做的 事实表、维度表怎么设计 数据完整性、唯一性怎么保证 数据怎么分区,如果增量同步,需要历史数据合并分区慢怎么解决 数仓如何进行组件选型,理由 数仓建设过程中有哪些难点 atlas如何获取数据血缘 拉链表怎么设计 你觉得拉链表常用吗,为什么不用 那你为什么要设计拉链表 sql题 分组topn row_number rank dense_rank区别 看两个sql,差异在哪,哪个
一面:2023.2.7 30min 自我介绍 为什么要换实习 了不了解数仓知识 sql题,各城市观看量前10的用户,能不能保证每次刷数的结果一致 sql题,连续登陆 数据倾斜啥情况,怎么解决 了解即时查询组件吗?CK ES Durid之类? hive2ck有啥要注意的 反问 二面:2023.2.8 40min 自我介绍 为啥要换实习 之前实习有没有什么遇到难点,怎么解决的 你觉得什么样的数仓是好数
#软件开发2023笔面经# 感觉自己表现还挺好的,问了面试官也说挺好,注意下细节,结果第二天就收到了感谢信,呜呜 一面 3.9 45min 1.自我介绍 2.threadlocal底层实现 3.aop ioc原理应用及相关注解 4.arraylist和linkedkist 5.mysql索引 6.mysql并发相关问题 7.mysql事务 8.mysql刷盘原理 9.redis持久化 10.red
公司:北京快手 面试时间:2024.07.04,共计55分钟 问题 自我介绍 Java中Map在内存中的存储结构,如何存储数据? HashMap的底层数据结构是什么? 介绍一下ArrayList? int a1[4096]; Integer a2[4096]; 两个数组求和哪个更快? 对连续内存的数据做计算,CPU会有哪些加速设计? Java中创建对象返回的引用地址和物理内存条中的地址有什么关系?
公司:广州网易互娱 面试时间:2024.07.23,共计65分钟 共两位技术面试官,轮流提问 流程:自我介绍、项目、基础知识(Java基础方面、数据库方面、计算机基础方面(操作系统)、计算机网络方面)、算法笔试。 问题 自我介绍 项目方面 成本治理中负责的工作内容 数据平台中,任务计算成本的计费维度 Spark作业从哪些方面可以发现能够优化? Spark作业可以从哪些方面进行优化? 从哪些配置入手
一面 实习深挖 实习中遇到什么难点 数仓如何分层,每层如何设计模型 发现凌晨任务挂了,讲快速排查思路 几种join方式的区别 如何优化使用row_number的效率 拉链表原理和作用 对etl的理解 cte的特点 sql每个部门薪资最高的员工,要求两种方法 算法构造二叉树 二叉树几种遍历方式实现 介绍栈和队列,以及各自的应用场景 还有些忘记了,都怪库克没做录音功能 二面 实习深挖 有过什么任务优化
一面 8.15 45min 0. 现在状况,职业规划 1. 问简历上数据建模的项目 2. 你的理解数据建模应该怎么进行 3. 了解数据库事务吗 4. 主键和唯一索引知道吗 5. 用过hive吗,数据倾斜怎么回事 6. 数据结构/算法怎么样?了解排序吗?哪几种排序?稳定性问题? 7. 编程题 python 给有3个或更多个数的数组,返回最大能组成三角形的周长 8. sql题 简单的group by
项目为sgg经典离线数仓 1. 自我介绍 2. 项目介绍(难点、亮点) 3. 根据难点亮点提问 4. 数据域是什么,如何划分数据域,为什么这样划分数据域 5. DIM层维度表的设计原则 6. DWD层事实表设计要点 7. mapreduce shuffle流程 8. maptask和reduce task 与哪些因素有关 9. 数据热点(数据倾斜)在哪些场景下出现,如何解决 10. spark是为
Timeline: 8.27 投递 8.30 笔试 9.15 HR面 9.26 技术面 10.9 offer 9.15 一面 20min: 1.对互联网公司加班的看法 2.有考研计划吗 3.为什么投多益 4.喜欢游戏吗 5.评价父亲 6.家里的情况 7.实习未转正原因 8.如何看待军人的天职 9.看重公司哪一方面 10.能否提前实习 11.是否单身 12.主观题是否是自己写的 9.26 46min
1. 自我介绍 2. 之前的实习在干啥 3. spark、mapreduce区别 4. 问了一堆Python相关的函数和包,答得挺模糊,还有拷贝估计是想问深拷贝浅拷贝区别我脑子短路没明白问的啥就说忘了(太久没写Python了都在练sql😭😭) 5. 机器学习算法聚类用啥,线性回归和逻辑回归(我也不知道为啥会问这个) 6. 口述sql,求班级各科目排名前三 7. 学校有开大数据开发课吗,自己怎么
1. 互相自我介绍 2. 实习时团队合作出现过哪些问题,如何处理,项目怎么做的 3. 三个词形容自己 4. 成绩还可以,为什么不考研 5. 有没有特别想改变的缺点 6. 父母工作,是独生女吗 7. 你认为在学校和工作的区别是什么 8. 有没有对象,哪里人 9. 对自己影响最大的人 10. 还投了哪些公司,有没有offer,为什么选择淘天 11. 能实习多久,什么时候能到岗 反问:什么时候出结果(清