一面 redis: RDB和AOF的区别 AOF中记录的是什么,RDB中记录了什么 过期数据的删除策略 使用这些删除策略可能会出现哪些问题 定期删除是所有数据删除吗 内存淘汰机制 allkeys详细说说 redis使用场景 redis和memcached有什么区别 为什么用单线程不用多线程 clickhouse(实习里用的主要是这个): 简单介绍一下clickhouse,说说为什么用这个 说一下R
#百度#面试官很好,总体感觉问的比较简单,但是好久不看八股感觉很多都忘记...理解还是比较浅层,一些实战方面的内容还比较欠缺...要努力了!!!
一面: 无自我介绍环节,直接开问 1、聊实习项目,很细,聊了好久 2、yarn任务提交流程 3、spark的stage切分原理 4、spark任务提交流程 5、对比mr和spark,为什么都用spark 6、谈谈对hudi的理解 7、kafka的负载均衡原理 8、两道算法题,字符串相关的 9、反问 ps.好多过程不记得了 二面: 三个模块 开发 大数据 算法 不想回忆了,直接自闭,一点都不会 但是
一面: 主要还是挖简历 自我介绍 问项目经历,聊聊过往开发的项目(聊了很久) 聊聊MySQL的事务 细聊ACID 隔离级别 innodb默认级别 innodb的底层数据存储 对比mysql和hive kafka为什么吞吐量大 场景题目:100个G的文件,保存用户id和看的bookid,求top10阅读量的书 反问
#百度##测试#小度质量部 072面试1h 1. 自我介绍 2. 项目具体情况 3. 实习情况 4. 工作中遇到多进程/多线程的问题 5. 序列号生成的方式 6. Python多线程和多进程的性能问题 (告知面试官自己理论方面是对Java更多了解一些 7. Java的数据类型有哪些 8. 整型占几个字节、int型数据范围 9. Java中String类直接赋值一个常量和直接new一个新的对象的区别
一面: 感觉一上来就是主管面,主业务面,考验业务能力和沟通能力 介绍下专业的课程,说说最喜欢哪一门,为什么 直接问实习经历 实习中的项目,扣细节(大部分时间都在问这个) 在同程做了什么业务 广告业务数仓负责哪些东西 广告投放的指标,如曝光、转化等等 广告有哪些类型 聊聊广告投放流程,投前、投中、投后 投中的过程每一轮具体的事情 对比hive和spark 为什么业界都用spark不用mr了 聊聊fl
2022-07-22 时长1h 1 自我介绍 2 数仓项目数据量多大 3 几个shell问题,监控spark日志内容并写入到另一个文件、实时监控spark日志内容 4 Java关键字、面向对象三大特征、接口和抽象类区别 5 set list map区别 6 介绍JVM内存区域,String是基本数据类型吗?基本数据类型变量存在哪里 7 垃圾回收机制 8 新生代老年代对象是如何流转的 9 创建线程的
2022-07-27 下午 时长1h5min 百度的面试官真的很好,这点没得说 1 自我介绍 2 数据倾斜——结合业务说了分组聚合和join,大表大表join怎么解决数据倾斜,展开说 3 SQL 没做出来,但是面试官全程提示,沟通交流 4 Hive和Spark哪个比较熟悉,我们聊一聊——都比较熟悉,问了Hive组件和底层执行逻辑,逻辑计划优化有哪些方法,什么是谓词下推(自己提到了) 5 算法:数组
发面经,攒好运 面试官是个小姐姐,说话非常温柔,但万万没想到面得内容和后端确实关系不大 自我介绍 你用了redis,那能说说他有什么好处吗以及他适用于什么场景? 那redis有什么缺点呢?(我不太清楚,只能说内存要求可能比较高?以及缓存雪崩和击穿) 数据库四大特性以及四大隔离级别 说说持久性 索引以及你用过索引吗 分享一下你在做项目的时候有没有遇到什么比较大的挑战 然后考了一道简单的mysql j
首先是自我介绍:balabala 是否了解过数仓和Spark? 再Linux系统中,找到对应的Java进程并删除。 同样的在 Linux系统下,删除使用某端口的进程。 介绍一下Mysql和LSM,并分析下这两种引擎是基于什么?适用于什么场景? sql编程题:牛客每个人最近的登录日期(二)() 算法题:二叉树的最大路径和 (较难) AC Code: class Solution { public:
#国企#一面 约37min 1. 介绍一下项目 2. MongoDB分布式存储是怎么做的? - 数据分片是怎么做的? - 如何保证节点间数据的一致性? - 如果有节点挂掉会怎么办? 1. 地理数据如何索引? 2. 喜欢用什么开发语言? 二面 约40-50min - 自我介绍 - 问了一些奖学金的情况 - 介绍项目经历 - 对分布式事务了解吗?解释一下分布式事务是做什么的 - 如何保证分布式事务的原
公司:广州网易互娱 面试时间:2024.07.23,共计65分钟 共两位技术面试官,轮流提问 流程:自我介绍、项目、基础知识(Java基础方面、数据库方面、计算机基础方面(操作系统)、计算机网络方面)、算法笔试。 问题 自我介绍 项目方面 成本治理中负责的工作内容 数据平台中,任务计算成本的计费维度 Spark作业从哪些方面可以发现能够优化? Spark作业可以从哪些方面进行优化? 从哪些配置入手
其实主要怪我简历写的太宽泛了 按简历写的技能问的 1.tcp/udp 传输层相关 2.http https 3.arp dhcp 4.组播 广播 5.栈 队列 二叉树 平衡二叉树 图 完全图 6.鼠标按下之后 到页面反应 计算机系统的驱动程序和cpu等发生的事情 7.python gil锁 8.java jvm 9.项目用了什么框架(就写了脚本) 10.sql 连接 11.编程:树的深度优先遍历(
#面经##百度2024校园招聘##测试开发# 1、自我介绍 2、为什么会选择自学C++,为什么不考虑其他语言 3、C++与C相比谁的效率高 4、你当时是怎么做webserver这个项目的,为什么要做这个项目 5、除了epoll,还有哪些I/O多路复用技术 6、它们的优缺点 7、什么时候用select比epoll好 8、ET和LT的区别 9、你知道哪些设计模式 10、单例模式简单介绍下,它有什么优点
#面经##百度2024校园招聘##测试开发# 1、自我介绍 2、项目背景、分工、需求介绍 3、C++内存模型 4、DNS 5、数据库事务 6、场景测试用例设计(邀请好友拆红包)(面试官人很好,一直在引导,可惜还是有很多没有考虑到,思路太局限了) 7、为什么会选择测试开发岗 8、有没有技术是你不熟悉、不适应但必须要学的,你是怎么学的 9、你认为自己项目中的分工合理吗 10、代码:整数数组中除了一个数