2022-07-27 下午 时长1h5min 百度的面试官真的很好,这点没得说 1 自我介绍 2 数据倾斜——结合业务说了分组聚合和join,大表大表join怎么解决数据倾斜,展开说 3 SQL 没做出来,但是面试官全程提示,沟通交流 4 Hive和Spark哪个比较熟悉,我们聊一聊——都比较熟悉,问了Hive组件和底层执行逻辑,逻辑计划优化有哪些方法,什么是谓词下推(自己提到了) 5 算法:数组
1h 面试官没开摄像头,然后我也没开~ 1. 自我介绍 2. 项目介绍 3. Java NIO原理,与BIO有什么区别 4. 线程不安全的类有哪些 4. G1回收器原理 4. 类加载过程 4. GCROOTS由什么组成 5. 数据库索引 6. 数据库的事务和一致性 7. 计网分层结构 8. TCP和UDP的区别 9. TCP怎么实现可靠传输 10. HTTP3.0展开讲讲 11. 进程和线程的区别
#面经##面经#1. hdfs的shell命令,说实话没想到会问这个(平时用都是直接网上查api),让我说如何查看文件前五行,如何复制文件,详细到把命令行+参数都说一遍 2. mapreduce流程 3. mapreduce和spark区别 4. 讲一下spark的rdd 5. 讲一下hdfs架构,2ndNameNode工作机制 6. java基本类型和引用类型的区别,==和equals()的区别
Spider 抓取系统的基本框架 互联网信息爆发式增长,如何有效的获取并利用这些信息是搜索引擎工作中的首要环节。数据抓取系统作为整个搜索系统中的上游,主要负责互联网信息的搜集、保存、更新环节,它像蜘蛛一样在网络间爬来爬去,因此通常会被叫做 “spider”。例如我们常用的几家通用搜索引擎蜘蛛被称为:Baiduspdier、Googlebot、Sogou Web Spider 等。 Spider 抓
百度小程序 SDK 部署文档 1. 百度小程序后台为小程序添加合法域名: jice.fw4.me ac.jice.io 2. 引入 JS // 具体引入目录根据实际情况调整 import jice from './jice.min.js' 将下载的 SDK 文件放入对应的目录下,且在 app.js 中引入; 下载百度小程序 SDK(无框架版、百度小程序 SDK(框架版) 3. 初始化 在 ap
类似微信小游戏,百度小游戏为了保护其社交关系链数据,也实现了一个 开放数据域 ,可以获取到同玩且双向关注的好友信息。这是一个单独的游戏执行环境。开放数据域中的资源、引擎、程序,都和主游戏完全隔离,开发者只有在开放数据域中才能访问百度小游戏提供的 swan.getUserInfo()、swan.getUserCloudStorage() 和 swan.getFriendCloudStorage()
使用指南 - 代码安装 - 安装方法 - 在 AMP 页面中添加百度统计 在 AMP 页面中添加百度统计 与 MIP 同理,AMP 是 google 开发的一种构建网页快速呈现的静态内容的方式。 AMP 中的 amp-analytics 组件 能够对页面中的用户数据进行分析。现在我们在 amp-analytics 组件中添加了百度统计的配置,实现了百度统计对 AMP 页面的支持。 使用 首先,要想
百度统计分析云是一款稳定、专业、安全的数据分析产品,提供数据看板、行为分析、用户管理、商业转化等多个板块的高阶分析能力,帮助提升客户各职能角色工作效能,以数据分析助力企业达成用户全生命周期增长。
为什么没有一面,直接二面,因为一面忘了录音,难受。 不过也是经历了几次百度的面试,感觉百度面试的特点就是比较重视代码能力,虽然忘了一面的具体内容,不过能记得面试过程中也是跟二面一样,会现场编辑一些代码,做题,找回了大学C++考试的感觉。 1、面试简单说明一下岗位 2、自我介绍 3、简单说一下实习过程中的工作 4、直接上代码考核,两道题,看图一图二 5、多进程题目,获取互斥锁或者读写锁的顺序,见图三
一面 一小时 介绍自己的项目 项目相关问题(其中一个是问方法/论文的创新点在哪) 协方差和相关系数是什么,他们的的关系是什么 L1范数和L2范数的区别 谈谈Sigmoid ReLU函数在0点的梯度怎么处理 Transformer和Rnn的区别 谈谈Transformer多头注意力机制,多头注意力和普通注意力的区别 从普通注意力换成多头注意力会导致参数暴涨吗?如果有所增加的话,请分析主要是哪个结构导
从十一月初开始,本鼠陆陆续续面了滴滴、快手、百度三家公司,目前的进展是:滴滴排序挂,快手三面挂,百度oc。如果没有意外发生的话,大概率鼠鼠会去百度开启下一段旅行了。之前面试的时候经常到牛客上搜索面经,本着开源的精神,也将自己的面经简单的做一个分享,希望大家不要嫌弃 百度 一面(45min) 介绍一下你的开源经历吧 我最近也研究过opensumi,你能说一下依赖注入吗 还在项目中使用过哪些设计模式呢
一面 1. PTQ和QAT的区别 2. 如果对embedding也做量化,你觉得会有什么问题 3. 说一下常见的量化方法和原理 4. 假如现在让你对transformer模型进行量化,你觉得需要量化哪些算子 5. 矩阵乘法算子的量化过程 手撕(如流IDE) 1. 搜索二维矩阵 Ⅱ lc原题 2. Top k 3. python pep9规范 问题 二面:交叉面 1. SLU和NLU的区别 2. 其
1.自我介绍 介绍完了,打开共享,对着简历一点一点问 2.ffmpeg在项目中是怎么使用的 3.为什么使用toml配置 4.项目的并发量上来了怎么办 5.把文件存在本地,数据量上来了怎么办 6.视频合成会不会遇到什么问题 7.项目的日志是怎么建立的,有没有对日志进行分类、分期 8.多进程、多线程的区别(答的不是很好,但最终还是落到点子上了,通信方式的不同) 9.redis和MySQL的区别 10.
#秋招# JAVA: 1.java面对对象的特征 2.Java中基本类型有哪些 3.==和equals的区别 4.为什么重写equals要重写hashcode 5.List,map,set什么区别 6.Try,catch,finally 分别作用是什么 大数据: 7.hdfs的读流程 8.项目里用到的 hive on spark 和 普通的hive有什么区别 9.数据倾斜的优化,如果group b
第一次参加社招面试,记录一下。 先来了一道算法题:找出最左边的次数最多的字母。 1. kotlin的let,apply,also有什么区别。 2. kotlin的inline,nonline关键字有什么作用。 3. 异步调用有几种方式,从简单到复杂。 4. 如何全局管理异步任务(不知道) 5. mvvm与mvp的区别。 6. 逆变与协变。 7. content provider的作用。 8. sq