11.17 -----云数据库研发实习生(1小时) 全部是项目相关的提问,体验非常好 1、了解Etcd吗,介绍一下Etcd的存储结构和它的数据一致性如何保证(Raft算法) 2、你知道哪些负载均衡策略 3、知道哪些心跳包检测算法 4、介绍一下你的心跳包检测算法 5、为什么你IM系统的计时器不使用Go原生的计时器 6、聊聊时间轮算法和它环形数据结构实现 7、你IM系统中为什么需要大key删除(从业务
1、 项目一直挖 2、 Spark调优 3、 Shuffle之类的优化 4、 平常写SQL注重优化之类的问题 5、 第一道题让看下面Java代码写输出。 private static void test(int[] arr) { for (int i = 0; i < arr.length; i++) { try { if (arr[i] % 2
10.16投递 10.17一面(50minute) 自我介绍 项目细节 mysql(这里问了很多) 大数据的基本八股 计算机网络tcp 一道sql题,一道算法题 (吐槽一下百度的如流,用网页端看不到聊天框,最后还是下载了客户端才看到,面百度的小伙伴记住面试了要下载如流) 反问:问了一下业务 10.19二面(30minute) 自我介绍 项目细节流程 两个项目的关系 为什么不继续做大模型 实习多久
#秋招# JAVA: 1.java面对对象的特征 2.Java中基本类型有哪些 3.==和equals的区别 4.为什么重写equals要重写hashcode 5.List,map,set什么区别 6.Try,catch,finally 分别作用是什么 大数据: 7.hdfs的读流程 8.项目里用到的 hive on spark 和 普通的hive有什么区别 9.数据倾斜的优化,如果group b
一面 redis: RDB和AOF的区别 AOF中记录的是什么,RDB中记录了什么 过期数据的删除策略 使用这些删除策略可能会出现哪些问题 定期删除是所有数据删除吗 内存淘汰机制 allkeys详细说说 redis使用场景 redis和memcached有什么区别 为什么用单线程不用多线程 clickhouse(实习里用的主要是这个): 简单介绍一下clickhouse,说说为什么用这个 说一下R
mapreduce中有哪些排序 yarn的事件驱动 hbase写热点问题 建表时怎么指定空region spark sql中dataframe怎么把表中的字段提取出来 hive怎么提取出来 yarn中的container怎么实现 写一个sql,学生不同学科的得分排名前三 手写单例模式,策略模式,工厂模式,并描述在什么场景下使用,口述一下装饰者模式 arraylist和linkedlist的区别,什
#百度面经# 个人情况:23届,211硕,大数据开发,数仓,入职即被裁,找工作ing... 今天面试了百度搜索的数据挖掘岗位,面试官超级nice,先大概讲了岗位情况,问下意向,由于我之前想的最长远的发展路线就是先搞底层技术,再搞分析,最后能转挖掘的话更好,就说还OK,就接着面了,一共五部分 1. 统计学 早还给老师了 2. AB实验 只听过名字 3. 机器/深度学习 知道的太基础了,没法应对面试
1. 自我介绍 2. 项目嘟嘟嘟 3. CAP(当时脑子抽了说直接不知道) 4. 谈谈虚拟机和容器 5. 对数据库前景的看法(说主要看好ap) 6. 介绍国产数据库(说了一堆,就没说百度的数据库,面试官直接让我打住) 7. 优势劣势。 感觉能让我踩的坑全让我踩了中途还接了两个电话,不了解目标厂的数据库产品...
首先想说面试官真的好!很善解人意,听出到菜鸡的紧张不停地安慰我 总时长大概一个小时 1.自我介绍。 2.python的lambda函数举例实现。 3.说说python内置的数据解构。 4.ACID。 5.撕项目,大概20多分钟。 6.你知道的排序算法有哪些,HR选了一个排序,说一下基本的算法思想。 7.是否用过索引,介绍一下你所了解的索引 8.(因为简历)java的熟悉程度如何。 9.窄依赖和宽依
推荐阅读文章列表:大数据开发面试笔记V4.0 || 面试聊数仓第一季 || 小白大数据学习路线 一、前言 7月11日,百度开启了2024届校园招聘提前批专场!!! 同学们不要担心没准备好,只用准备到8成即可,赶紧投起来,hc有限!!! 为了帮助大家收割百度提前批offer,最近整理了一些百度高频的面试题,题目不多,建议全部吃透!!! 二、高频面试题总结 1. Flink里面断流怎么处理 线上断流指
timeline:7.10投递——7.12约面——7.13一面 面试时长:30min 面试形式:远程视频 P1:在线coding 两道SQL大题 3min思考 口述思路 具体到会使用的函数 初中级难度刷牛客SQL即可答出 P2:简历 介绍实习工作 围绕实习经历提一些问题 P3:反问 工作内容、常用代码软件、工作时长(早十晚九)、工作氛围 KPI面,面试官不开摄像头,面试时长30min不到,简历问一
最难蚌的一次面试 百度数据科学实习生,文心一言产品线那边的 有认识的人面过同样的岗位说问的都是业务问题,稍微考了很简单的Python基础函数(处理JSON文件) 结果面试官除了简历没问业务方面的问题,然后问了简历项目上我用过的很多算法问题,很多SQL和Python的函数还有模型,什么窗口函数(并试图提问数据仓库相关),bagging和boost算法的一些关键点和主要区别,怎么预测和进行特征选择,然
一面,7月17日,面试官是数据分析师 1. 自我介绍。 2. 实习中最有成就感的一段经历?实习经历深挖。 3. 使用过百度APP吗? 4. 知乎优缺点以及优化改进建议。 5. 对直播了解吗,直播为什么能吸引用户? 6. 对数据分析师的看法,以及自己的优势? 7. 某日APP日活突然下降,如何分析? 8. 数分相关硬技术如何? 9. 反问。 二面,7月30日,面试官是产品经理,两周后挂 1. 自我介
第一次2022年下半年,面试百度的大数据开发实习生岗 一战 一面问了很多的大数据的基础性知识,常规的hadoop、spark、flink的八股 写了简单的算法 问了之前再同程的实习经历 问了学校做的项目 二战 二面很快就开始,电话面试 主要的难点在于主问flink实时的原理,给了个场景,如何保证数据延时和不丢数 当时也不太懂,纯感觉设计,然后跟着面试官的引导也差不多答出来了 三战 三面紧接着二面就
百度贴吧业务部数据分析日常实习两面 一面 1. 自我介绍。 2. 说一下SELECT FROM WHERE GROUP BY HAVING ORDER BY的执行顺序。 3. 说一下SQL和Hive SQL的不同。 4. 平常用SQL还是Hive SQL? 5. SQL题:①用户id,月份,销售额。计算每个月的用户数;截至当月的用户数;截至当月的销售额。②学生id,科目(语文、数学),成绩。计算语