一面: 无自我介绍环节,直接开问 1、聊实习项目,很细,聊了好久 2、yarn任务提交流程 3、spark的stage切分原理 4、spark任务提交流程 5、对比mr和spark,为什么都用spark 6、谈谈对hudi的理解 7、kafka的负载均衡原理 8、两道算法题,字符串相关的 9、反问 ps.好多过程不记得了 二面: 三个模块 开发 大数据 算法 不想回忆了,直接自闭,一点都不会 但是
我们有一个包含对象集合的开发服务器。这些对象的实际积累是一个持续的过程,在这个本地开发服务器上运行标签、验证等的整个过程。一旦这些对象准备好生产,它们就会被添加到生产数据库中,从那时起,生产数据库将在其计算中使用它们。 我正在寻找一种简单地将增量(新对象)添加到生产数据库中的方法,同时将所有其他集合和旧对象保留在同一个集合中。到目前为止,我们一直使用MySql,所以这个过程只涉及运行数据库结构和数
10月9号一面技术面 1.5h 问了项目+一些八股 手撕两道: 1.生产者消费者 2.K个一组反转链表 要自己构造链表和打印链表 10月10号直接oc....这效率我都惊了 #C++工程师#
岗位:Java开发工程师 时间:9.20 题目 项目经历 介绍下比较熟的项目和其中的点 索引是怎么实现的 如果数据量比较大会不会引起性能变化 实习经历 RPC介绍一下 如果调用发现很慢怎么排查 slf4j优点 八股 MySQL与Redis区别,后者能不能替代前者 Redis为什么要分布式 进程和线程 怎么多线程,不用锁呢 算法 不含重复字符的最长子串的长度 总结 携程面试总体来说还是比较全面的,从
刚刚oc了,有没有佬可以介绍下shopee food的情况,bp搜推算法 #shopee#
主要内容:添加数据源PyCharm支持各种类型数据库的接口支持。 当用户授予对创建的数据库的访问权限,它就会使用提供代码完成的SQL编写工具提供数据库的模式图。 在本章中,我们将重点介绍MySQL数据库连接,其中涉及以下步骤。 添加数据源 请注意PyCharm支持各种数据库连接,这一点很重要。 第1步 打开数据库工具窗口:View -> Tool Windows -> Database,并打开名为数据源和对话框的对话
数据库工具类提供了一些方法用于帮助你管理你的数据库。 初始化工具类 使用数据库工具类 获取数据库名称列表 判断一个数据库是否存在 优化表 修复表 优化数据库 将查询结果导出到 CSV 文档 将查询结果导出到 XML 文档 备份你的数据库 数据备份说明 使用示例 设置备份参数 备份参数说明 类参考 初始化工具类 重要 由于工具类依赖于数据库驱动器,为了初始化工具类,你的数据库驱动器必须已经运行。 加
数据库工厂类提供了一些方法来帮助你管理你的数据库。 Table of Contents 数据库工厂类 初始化数据库工厂类 创建和删除数据库 创建和删除数据表 添加字段 添加键 创建表 删除表 重命名表 修改表 给表添加列 从表中删除列 修改表中的某个列 类参考 初始化数据库工厂类 重要 由于数据库工厂类依赖于数据库驱动器,为了初始化该类,你的数据库驱动器必须已经运行。 加载数据库工厂类的代码如下:
1面(1h)8.2 项目介绍 MapReduce提交作业流程 MapReduce和spark的区别 HDFS架构 HDFS写流程 groupByKey和reduceBykey的区别 算法题(实现一个类,插值(已存在就false,不存在就插入),删除值(不存在这个值就返回false,存在就删除),随机获取已存储的值,三个功能时间复杂度为O(1)) 2面(45min)8.10 项目介绍 数仓理解 ja
做个记录 基本上问项目,根据简历项目和实习的技术点衍生去问的 写面经攒人品~ 1.自我介绍 2.数据仓库的分层,以及为什么要做数据仓库 3.数据仓库的血缘关系 4.拉链表的实现 5.hive的压缩格式和存储格式 6.星型模型和雪花模型优缺点 7.spark和hadoop的区别 8.spark数据倾斜发生原因及解决方案 9.spark的新特性AQE和DPP 10.kafaka的特性 11.kafak
废话不多说直接上干货: 11.24 初试(基本是通用知识)40min 问答: 自我介绍 提问技术栈(我是c++和python) c++和python的区别(语言特性) MySQL的索引架构,内部采用了什么结构 B+树的结构是什么 什么是红黑树,简单介绍一下其性质,讲一下红黑树插入的具体过程 手撕: 1.查询合并两个SQL表 2.给定递增序列求最长等差子序列 3.用两个栈实现队列 初试通过后隔一个工
Timeline: 9.1 投递 9.14 笔试 9.25 一面 11.1 二面 技术+HR面 9.25 一面 23min: 1.项目经历 2.数仓分层 3.数仓执行引擎 4.Sql关键字执行顺序 5.Mysql索引引擎 6.Innodb和myisam区别 7.Flink基本算子 8.Map和flatmap 9.Keyby 10.数据倾斜 怎么定位 11.Hive分区表和非分区表 12.增加或删
一面 聊项目 2道sql lead/lag函数 like pandas基础 数据倾斜问题 二面 聊项目 表连接方式 数仓各层作用 数仓建模类型有哪些 维度模型有哪几种 sql执行计划 mr过程 数学建模怎么分工 为什么不读研 数据中台产品了解哪些 已oc #面经#
投递岗位:后端开发工程师(西安) 投递base:西安 投递时间线:9.19投递,10.20收到笔试邀请链接,10.23笔试 考试内容:固定时间19:00-20:10,4部分,使用国考平台,除了编程其它都部分提交完不可修改。 1.行测数学:10道,类似行测里的数学计算,感觉更简单一点,排列组合更多更难一点。 2.单选:45道,涉及数据库,计算机网络,操作系统,java语言基础,数据结构等等,有难度,
三一重工笔试大家都说挺简单的,还是提前批,所以最近也没抽时间来复习,直接上来裸考。 题目全是选择题,有三十道单选题,十道多选题。笔试限时一小时做完,实际上不到十分钟大部分就选完了。以下凭记忆记录几个题目,当然我也很多没做对~ 算是查缺补漏了。 1. hadoop 环形缓冲区大小? 2. spark 行动算子和转换算子识别? 参考链接: https://blog.csdn.net/weixin_