数据库工厂类提供了一些方法来帮助你管理你的数据库。 Table of Contents 数据库工厂类 初始化数据库工厂类 创建和删除数据库 创建和删除数据表 添加字段 添加键 创建表 删除表 重命名表 修改表 给表添加列 从表中删除列 修改表中的某个列 类参考 初始化数据库工厂类 重要 由于数据库工厂类依赖于数据库驱动器,为了初始化该类,你的数据库驱动器必须已经运行。 加载数据库工厂类的代码如下:
40min 1. 自我介绍 2. 用户行为漏斗分析,从ods层开始全链路步骤,埋点如何设计,应该关注哪些触发的动作 采集到ods层的数据什么样的,有哪些字段 dwd层设计了哪些事实表 dim维度又有哪些表 dws层汇总聚合了哪些表与用户行为漏斗有关,这些表怎么设计的 最后ads层漏斗分析怎么做,如何可视化 3. 手撕sql 连续7天登录 4. 反问
刚刚oc了,有没有佬可以介绍下shopee food的情况,bp搜推算法 #shopee#
1面(1h)8.2 项目介绍 MapReduce提交作业流程 MapReduce和spark的区别 HDFS架构 HDFS写流程 groupByKey和reduceBykey的区别 算法题(实现一个类,插值(已存在就false,不存在就插入),删除值(不存在这个值就返回false,存在就删除),随机获取已存储的值,三个功能时间复杂度为O(1)) 2面(45min)8.10 项目介绍 数仓理解 ja
做个记录 基本上问项目,根据简历项目和实习的技术点衍生去问的 写面经攒人品~ 1.自我介绍 2.数据仓库的分层,以及为什么要做数据仓库 3.数据仓库的血缘关系 4.拉链表的实现 5.hive的压缩格式和存储格式 6.星型模型和雪花模型优缺点 7.spark和hadoop的区别 8.spark数据倾斜发生原因及解决方案 9.spark的新特性AQE和DPP 10.kafaka的特性 11.kafak
1、自我介绍 2、跳槽理由 3、介绍团队 4、自己感觉做的最好的项目(扣的很细,聊了很久) 5、遇到过的技术问题 6、数据倾斜如何解决 7、缓慢变化维怎么解决 8、周期变化事实数据,比如七天累计订单表应该放哪一层?为什么? 9、什么数仓才算一个好的数仓 10、雪花模型跟星型模型区别 11、写sql题 12、反问 面了三家 淘天、字节、pdd,都offer了,这个草稿也是当时写的一直忘发了,后面有空
废话不多说直接上干货: 11.24 初试(基本是通用知识)40min 问答: 自我介绍 提问技术栈(我是c++和python) c++和python的区别(语言特性) MySQL的索引架构,内部采用了什么结构 B+树的结构是什么 什么是红黑树,简单介绍一下其性质,讲一下红黑树插入的具体过程 手撕: 1.查询合并两个SQL表 2.给定递增序列求最长等差子序列 3.用两个栈实现队列 初试通过后隔一个工
面试内容分为以下几个部分(时长:一小时 5分钟): 1.自我介绍。 2.出了一道算法题,将二叉树搜索树转换为双向链表,不新建链表结构,链表结构使用树节点的结构,左孩子代表前节点,右孩子代表后继节点。要求是在不新建节点的情况下实现转换。使用中序遍历解答了。 3.做完算法题目之后出了一道 SQL 题,为薪资表格中获奖人员的薪水字段加 10% 的工资,获奖人员由获奖表格可以查询得到。当时有点理解错误了,
3月1日晚笔试了2小时,我对Hadoop不甚了解,同时编程第一题暴力求解花费太多时间导致动态规划没有完成,寄 单选题10道,考察计算机网络、JAVA、Hadoop、MySQL等计算机基础知识 简答题3道,考察MySQL索引和优化、Hadoop大数据组件、对游戏指标的解读 编程题3道,一道Z字型变换(参考力扣第6题N字型变换),一道合并区间(力扣第56题),一道动态规划,都是中等难度 主观题2道,了
一面 1.自我介绍 2.最好的项目 3.数据可视化 4.research和find 5.try except 6.数仓的架构 二面 1.自我介绍 2.如何处理异常值和缺失值 3.numpy和pandas平时怎么用于数据预处理 4. pyspark怎么处理缺失值
一面 redis: RDB和AOF的区别 AOF中记录的是什么,RDB中记录了什么 过期数据的删除策略 使用这些删除策略可能会出现哪些问题 定期删除是所有数据删除吗 内存淘汰机制 allkeys详细说说 redis使用场景 redis和memcached有什么区别 为什么用单线程不用多线程 clickhouse(实习里用的主要是这个): 简单介绍一下clickhouse,说说为什么用这个 说一下R
三一重工笔试大家都说挺简单的,还是提前批,所以最近也没抽时间来复习,直接上来裸考。 题目全是选择题,有三十道单选题,十道多选题。笔试限时一小时做完,实际上不到十分钟大部分就选完了。以下凭记忆记录几个题目,当然我也很多没做对~ 算是查缺补漏了。 1. hadoop 环形缓冲区大小? 2. spark 行动算子和转换算子识别? 参考链接: https://blog.csdn.net/weixin_
一面 聊项目 2道sql lead/lag函数 like pandas基础 数据倾斜问题 二面 聊项目 表连接方式 数仓各层作用 数仓建模类型有哪些 维度模型有哪几种 sql执行计划 mr过程 数学建模怎么分工 为什么不读研 数据中台产品了解哪些 已oc #面经#
Timeline: 9.1 投递 9.14 笔试 9.25 一面 11.1 二面 技术+HR面 9.25 一面 23min: 1.项目经历 2.数仓分层 3.数仓执行引擎 4.Sql关键字执行顺序 5.Mysql索引引擎 6.Innodb和myisam区别 7.Flink基本算子 8.Map和flatmap 9.Keyby 10.数据倾斜 怎么定位 11.Hive分区表和非分区表 12.增加或删
投递岗位:后端开发工程师(西安) 投递base:西安 投递时间线:9.19投递,10.20收到笔试邀请链接,10.23笔试 考试内容:固定时间19:00-20:10,4部分,使用国考平台,除了编程其它都部分提交完不可修改。 1.行测数学:10道,类似行测里的数学计算,感觉更简单一点,排列组合更多更难一点。 2.单选:45道,涉及数据库,计算机网络,操作系统,java语言基础,数据结构等等,有难度,