面试官:你学过计算机网络吗 我:没有 面试官:你会flink嘛 我:不会 面试官:你用过spark嘛 我:没用过,不会 面试官:hadoop这些了解吗 我:不好意思,不了解。。。。 面试官:那我们来看一下MySQL吧,会联合索引判断嘛 我(思考十秒钟,发现没听说过):不好意思,不太了解。 面试官:那写一个sql题吧。 我(八分钟后):你好,我写完了。 面试官:没问题,你说哪里可以优化一下,不用操作
一面 12月28日 15:00 1h 了解分布式吗,看过哪些相关的分布式数据库和知识 看过哪些论文 深挖minisql项目 2PL 脏读,幻读,不可重复读 这个项目是怎么实现的,从0到1吗,介绍一下实现的过程 支持哪些SQL数据类型 日志系统的设计(支持哪些日志格式) 如果用户写入一个大的blob日志怎么处理 fsync怎么处理的 redo log在commit之前还是之后处理的 是否有丢失数据的
一,上来就问了项目里日志的处理量,50w 100M左右 二,问项目里如何解决Hbase的热点问题,面试官没听明白,后面就直接问热点问题如何解决的 答的就举年份例子,加盐,预分区 三,Kafka里是如何leader和follow是如何实现同步的 具体怎么实现同步我确实不知道,我就答的是offset在follow和leader挂了后如何在实现同步的,面试官说我似乎说了又没说明白,后面查了一下,下
一面 8.15 45min 0. 现在状况,职业规划 1. 问简历上数据建模的项目 2. 你的理解数据建模应该怎么进行 3. 了解数据库事务吗 4. 主键和唯一索引知道吗 5. 用过hive吗,数据倾斜怎么回事 6. 数据结构/算法怎么样?了解排序吗?哪几种排序?稳定性问题? 7. 编程题 python 给有3个或更多个数的数组,返回最大能组成三角形的周长 8. sql题 简单的group by
本文向大家介绍web开发中添加数据源实现思路,包括了web开发中添加数据源实现思路的使用技巧和注意事项,需要的朋友参考一下 在web开发中,可以利用hibernate配置数据源,但在实际的应用中,可能要连接多个数据源, 1.配置dataSource 2.配置sessionFactory 3.添加jdbc支持 感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
一面 数据同步怎么做的 事实表、维度表怎么设计 数据完整性、唯一性怎么保证 数据怎么分区,如果增量同步,需要历史数据合并分区慢怎么解决 数仓如何进行组件选型,理由 数仓建设过程中有哪些难点 atlas如何获取数据血缘 拉链表怎么设计 你觉得拉链表常用吗,为什么不用 那你为什么要设计拉链表 sql题 分组topn row_number rank dense_rank区别 看两个sql,差异在哪,哪个
1. 自我介绍 2. jvm分区 3. springboot启动过程 4. mysql事务 5. char和varchar 6. char最大是多少 7. git命令以及提交过程 8. redis应用场景,这个比较拿手,实习用的太多了。 9. 反问 一共才18分钟,不知道是不是kpi面试,很基础,点到为止。 希望能有二面,好想去武汉。
1h 1面 自我介绍 项目介绍 事实维度建模的优点 维度建模方法 数仓分层和分主题的理由 OLAP平台了解吗 数据治理了解吗 spark shuffle展开讲一下 spark内存管理模型讲一下,分别存储哪些东西 hadoop优化思路有哪些 如何防止sql引起的数据倾斜 sql对比,找不同,join and和join where两者的区别 一道sql题,提示半天才做出来,对sql不太熟悉,很多了解的
9.22 线下群面,早上面完下午就收到测评 9.26 收到二面通知 9.28 二面 9.29 感谢信 9.28 二面 自我介绍 科研项目介绍、科研项目中存在哪些问题和瓶颈? Mapreduce 和 Hadoop 的工作原理、区别和联系? 旋转链表如何实现?(很简单的一个问题,一直和我扣细节纠结好久....) 反问 #美的##凉经#
saas平台,商城商品模块相关表设计 交以下内容 初始化数据 1.表数据字典 2.生成语句 3.自行模拟的数据导入语句 业务数据 1.后台新增语句 2.后台修改语句#秋招#
题型:20道选择题,3道编程题,其中第一题写SQL 笔试太难了?可以私信我 有些AC有些通过率还行,助攻已经进面了 选择题: 下列排序中需要额外辅助空间的期望值最大的是() 堆排序 希尔排序 快速排序 冒泡排序 双十一快到了,某服装厂为了赶制订单,加班加点使用设备生产衣服。如果某一设备在时间长度为的时间内发生故隙的次数服从分布N(t)~P(λt) (H松分布),求该设备在无故障工作8小时后再次
1.自我介绍 2.MR了解吗 3.MR map任务个数怎么确定的 4.Spark job task等怎么划分的 5.数据倾斜问题 解决方案 6.导致出现问题可能有哪些方面?数据倾斜 oom 小文件问题 7.数仓概念 分层相关 8.事实表和维度表 9.维度和维度属性 10.数仓建模相关 11.实际开发中,是选择维度多一些提高复用性还是少一些再拓展? 12.维度的界限你觉得怎么设置比较合理? 13.平
秋招第一面给了平安产险,投的平安产险总部科技管培生-数据开发,9月11投递的,9月16测评,9月18笔试,9月27开始一面。 3点59分,面试官准时打来电话,首先是自我介绍,然后面试官让介绍实习的项目,后面会根据简历上你写的东西问,其实也是岗位要求写的那些,问了数仓分层,还有java垃圾回收机制,数据结构,数学建模等方面相关的,历时23分钟,虽然答得不好,但是面试官也没让我难堪,说自己当时也是这么
# 一面 9.18 自我介绍 实习工作用的什么计算架构、开发节点怎么调度的、数据量多大、每天跑多久 介绍spark shuffle 阿里用的olap数据库是什么 阿里的onedata建模规范 了解clickhouse吗 可以接受来实习吗 你对自己的规划是什么 (到这里只有十几分钟,问我有什么想问的) 开始反问 # 二面 9.19 自我介绍 介绍Hadoop 介绍spark任务执行流程 Spark几
1.自我介绍 2.数据仓库分层 3.介绍项目 分工 难点 数分和数挖哪部分做的多 4.三范式 5.事务基本特性 6.存储和函数有什么区别(没懂) 7.为什么来杭州 8.反问