30min 自我介绍 项目: 介绍一下项目 几层。每层干了什么。去掉一层可以吗(又来) dwd和dws和ads都可以去掉 balabala 数据量 千万级别数据怎么同步? 业务datex+maxwell,行为 直接flume拉。 多久同步一次? 一天一次。 Ads层怎么接到可视化看板? 手拉(这边傻逼了,忘记说接clickhouse同步然后接到可视化软件上了) Zk在kafka里的作用? 保留of
面之前好像都没搜到这一批有什么面经,那我来发一发 超级无敌快的一次面试,提前了几分钟开始,提前了几分钟结束,大概就15分钟左右 面试官语速也超级快,并且提前声明他们就是流程快,不代表kpi面或者是对我不感兴趣 对着简历上的项目,一个个的技术点问 1、怎么实现发送邮件激活的功能 2、让用户去邮箱进行激活的时候前端后台是不停的在轮询么 3、AOP记录哪些日志 4、Mybatis里$和#的区别,数据安全
自我介绍 手撕,股票最大利润 sql 成绩排名三 数仓分层 数据倾斜 遇到的问题 为什么要分层 分析了哪些指标 介绍一下spark 介绍一下hadoop 介绍一下hbase 反问 不知道哪的问题,又凉了面了这么多0offer
一直都看大佬的面经学习,也写点面经回馈一下。 0822 一面 自我介绍 依次介绍项目 这块还是得重视,写在简历上的每个字都要烂熟于心 特别是小吹牛的部分。 C++相关 1.指针和引用的区别,引用和指针的自增自减有什么区别?sizeof指针和sizeof引用有什么区别? 2.指针常量和常量指针区别? 3.函数重写和重载有什么区别? 4.父类、子类和成员对象的析构顺序? 5.Vector末端插值和中间
首页大改版试验 试验场景 本为了带来更好的引流效果和浏览体验,对网站首页进行改版是我们定期都要做的一件事情;由于新老版本差异很大,我们在不确定用户是否认可前,将新版网站上线的风险很大;所以,利用A/B测试平台,将新版作为试验版本将其与旧版网站同时上线,通过用户行为数据来确定网站改版方向,这样更加稳妥。本例的目的是为了展示当试验网站改版时,如何进行试验操作。 例介绍的试验场景是购物流程的优化,即在流
效果展示 认识光环板的运动传感器 光环板的运动传感器可以检测光环板如何运动,包括摇晃、旋转角度、倾斜等。为光环板编程,使得LED灯颜色随着摇晃强度的变化而变化。 设置摇晃强度范围值 1. 添加运算类积木 ()>(50),修改数值为30,在()中添加传感器类积木 光环板的摇晃强度。 2. 添加控制类积木 如果()那么()。 编程LED灯效 3. 添加灯光类积木 全部LED显示()色,添加控制类积木
主要内容:1.什么是 Redis 大 key,2.大 key 会造成什么问题,3.如何找到大 key,4.如何删除大 key什么是 Redis 大 key 大 key 会造成什么问题 如何找到大 key 如何删除大 key 1.什么是 Redis 大 key 大 key 并不是指 key 的值很大,而是 key 对应的 value 很大。 一般而言,下面这两种情况被称为大 key: String 类型的值大于 10 KB; Hash、List、Set、ZSet 类型的元素的个数超过 5000个;
主要内容:1.现有数据存在的问题,2.系统架构1.现有数据存在的问题 1.1 开发数据服务门槛高 数据开发工程师除了开发完数据表外,通常还需要思考如下问题: 数据如何交付:业务通常期望使用数据接口方式来使用数据,而非数据表,这会更加灵活、解耦、高效。数据开发工程师因此需要建立对应的数据服务 服务如何开发:数据服务有多种形式,通常要求开发工程师有微服务知识、服务发现注册、高并发等 权限、可用性问题:开发完数据服务后,需要考虑权限问题,确保数据资
主要内容:1.开源OLAP综述,2.开源数仓解决方案1.开源OLAP综述 如今的开源数据引擎多种多样,不同种类的引擎满足了我们不同的需求。现在ROLAP计算存储一体的数据仓库主要有三种,即StarRocks(DorisDB),ClickHouse和Apache Doris。应用最广的数据查询系统主要有Druid,Kylin和HBase。MPP引擎主要有Trino,PrestoDB和Impala。这些引擎在行业内有着广泛的应用。 在云资源层,主要有E
主要内容:1.关系,2.区别1.关系 现在,没有什么流行词比大数据和人工智能更常见了。无数的分析家向我们保证,将从根本上重塑我们的日常生活。事实上,对于围绕人工智能和大数据的所有讨论,很少有人提到这两种新兴技术的融合,尤其是在解释人工智能为什么迫切需要大数据以取得成功的时候。 这是人工智能和大数据操作之间的秘密联系,以及这两种新兴趋势将如何主导21世纪。 没有大数据就不能拥有智能机器 在开始描述人工智能和大数据如何一起工作之
#非技术2023笔面经# 1.户籍和Base选择? 2.你是很坚定的选择一汽大众吗?了解这家公司吗? 3.为什么要选择一汽大众呢? 4.你就业的意向单位都是车企吗?· 5.你现在手里有 offer 吗?什么公司和进度? 6.车企面试有哪些? 7.你投了很多互联网的公司,再就是我们公司,那如果都给你递了offer的话,你会怎么选择? 8.为什么是团员但没有加入党组织? 9.大学绩点? 10.介绍一下
一面:自我介绍,让选择介绍其中一篇论文,主要会围绕论文展开一些问题以及场景分析,后面也有一些八股(Pytorch的广播机制相关的问题、Beam search的介绍,其他的记不太清了)感觉这些回答的没那么好。 二面:自我介绍,论文内容详细介绍,感觉面试官对于motivation和contribution比较在意,准备的也并没有那么好。 三面:自我介绍,论文内容的介绍,难点创新点等。其余的问题比较综合
1.数据分层概念 2.Hadoop 和spark 优缺点 3.数据倾斜 场景题 大表和小表join 4.宽窄依赖 5.sql题 6.走楼梯算法 7.hive的用户自定义方法区别
我一定是脑子进水了 投算法公司的算法岗 短短二十分钟的面试我要用一生去治愈 1.先简单自我介绍 2.介绍最有成就的项目,中间会打断你问一些细节,然后问你网络结构,算法原理 3.问你简历上其他项目(我的项目涉及到DGNN,问我DGNN原理) 4.xgboost和adaboost区别,xgboost实现的原理是什么 5.知道transformer吗 6.知道隐马尔可夫模型吗 7.知道端到端吗 8.手撕
之前面的科大讯飞算法岗位,补上面经。。 1.自我介绍 2.深挖项目 3.CNN、RNN、LSTM和Transformer各自的优点 CNN优点:局部权值共享,平移不变性可以更好提取特征以及处理高维数据;缺点:网络过深时其梯度回传变化相对于输入往往很小,出现梯度消失或爆炸的情况;解释性一般 RNN优点:相比于CNN,RNN结合序列上的时序上下文来提取特征,但是在处理序列数据时没有进行信息的过滤,在稍