timeline 10.24(周四)一面 10.28(周一)二面,当天约当天面 11.1(周五) 约三面,半小时后通知取消,官网流程结束 11.21(周四) 原地复活约三面 11.22(周五) 上午三面,下午oc 11.26(周二) offer邮件 #我的实习求职记录# #数开# #数开# #百度#
面试官到点没来,过了3分钟hr找来了,面试很随性,没怎么问,结尾才知道耽误别人午休了,面经如下 ------------------------------------------ 1.数据仓库大概分几层 2.波峰波谷sql 3.连续7天登录用户 4.spark有哪些优化 --------------------------------------------- 基本没问啥,以为是kpi面结果晚上
百度这个面试官感觉是做数分的,简历中充数量的数分项目都问了个遍,整体感觉还好,可能是缺人的原因,面经如下 -------------------------------------------- 1. 介绍用户行为分析及推荐系统构建项目 2. 数据来源 3. 数据维度有多少 4. kmeans按照什么聚类 5. 目标向量是什么 6. 漏斗分析的收益 7. 留存率流失率 8. 数仓分层架构 9. 活
自我介绍 实习工作介绍 事实表与维度表如何搭建 星型模型与雪花模型 维度冗余 业务场景理解 数据倾斜原因和常见手段 手撕 一道sql: 连续登录7天用户 两道算法: 二维动态规划 n! 尾数0的个数
1.深挖简历 2.GMV拆解 异动分析 3.数据分析工具竞品对比 没手撕 体感一般 分享攒好运🍀
自我介绍 专业课程、成绩 是否学过计算机专业课(408) 线程、进程的区别 编译型语言和解释性语言区别、使用场景 计算机32位、64位存储空间多大 Java内存存储 Linux通过文件名、文件内容查找 介绍Redash 比较ClickHouse、Doris和Mysql架构、使用场景和优缺点 b+树的优势 实习主要工作 反问: 如何使用好一个数据模型 对我的建议
自我介绍 深挖实习经历 (介绍实习主要工作、场景复盘等等延伸) hive相关 (hive原理、hive sql区别) 数据倾斜的常见case ClickHouse相关 group by原理 left join与right join区别与特点 主要技术栈 对岗位的理解 反问: 部门与产品业务线 校招生定位
#百度#面试官很好,总体感觉问的比较简单,但是好久不看八股感觉很多都忘记...理解还是比较浅层,一些实战方面的内容还比较欠缺...要努力了!!!
八股其实只是例行惯例简单问问,最重要的还是项目和实习!! 一面 4.29 1. 极其细致的拷打项目和实习 大约40分钟 2. 算法题:手写一个堆排序 3. 计算机网络架构,七层五层都可以 4. HTTP和HTTPS 5. HTTPS非对称加密机制 6. HTTP协议的Header有哪些?可以分类答 二面 4.30 1. 极其细致的拷打项目和实习 大约30分钟 2. 算法题:不使用正则找到所有花括号
0八股,全程问之前实习和做的项目,问实现细节和设计架构,聊了40min。期间我有不会的,或者说的不完整的,面试官也给我展开讲了。 十分钟手撕代码,两种方法写出来了。 发个面经贴,攒攒人品🙏
百度做TafDB的,支持百度云对象存储和文件系统存储的bu 1. 前面简单介绍了一些实习做的事儿 2. 分布式场景怎么保证消息一致性并且不重不漏 3. 假设有10台服务器同时在服务,用户只给其中一台发消息,其他几台服务器怎么同步的?集群管理是怎么做的 1. 比如说用户a连到 SERVER 1,用户 b 连到 SERVER 2。他俩之间,用户 b 是怎么看到用户 a 的消息的? 4. 实现二叉搜索树
🕒 岗位/面试时间 大数据研发实习生 👥 面试题目 一面(35min)3.11: 数开实习深挖 巨基础八股 shuffle过程 SQL语言执行顺序等等 做题(5min): 一道算法 一道SQL 反问(5min): 老哥贼热情给我介绍部门以及转正情况啥的 二面(35min)3.12: 数开实习深挖 巨基础八股 hdfs读写流程 数仓分层等等 做题(5min): 一道算法 一道SQL 反问(2mi
一面 实习深挖 对于高耗时任务的代码优化思路 如何发现不必要的扫表 sparksql和hivesql有什么区别 sparksql和hive on spark性能有差异吗,差异在哪 hdfs架构 datanode心跳机制 datanode挂了之后会怎么样,容错机制是怎么样 机架感知 有限内存下的一亿数据怎么排序 了解哪些shell命令 有a,b两个文件,存的都是id,写shell找出a中有但b中没有
1、上一份实习了4个月之后为什么不继续实习了? 2、我看你上一份实习主要是做机器学习是吧?你机器学习使用的是什么模型? (1)具体调用哪些算法你有研究过吗? (2)你的这个项目主要是做什么工作? (3)是不是大概就是从数据库拿数据,然后对数据进行清洗,然后在进行自动化调度、自动化训练对吧? (4)你数据库拿数据是使用sql拿吗,还是使用Python拿? (5)mysql和heidisql的区别是什
1.问项目 2.数据倾斜,spark,hive,问的比较多。大多是简单的八股 3.问java很多(没复习,哭死) ①java的多态是怎么实现的、 ②java泛型了解吗 ③java反射了解吗 ④java垃圾清理机制是什么 ⑤java多线程了解吗 直接一问三不知 4.sql现场写代码