公司:好未来 岗位:数据开发工程师 形式:视频面试 视频面试平台:牛客 时长:30分钟 流程: 1、自我介绍。 2、说一个最拿手的项目经历。 3、了解阿里数仓OneData体系吗? 4、了解大数据相关的应用框架吗? 5、对SQL优化有了解吗? 6、说一下Hive的工作原理。 7、Hive有索引吗? 8、Hive的内部表和
主要内容:1.建模锯齿,2.数据粒度的锯齿操作,3.下游表依赖上游表问题,4.数仓数据域划分方式,5.数仓一致性是如何保证的,6.数仓优化,7.数据全生命周期,8.数仓建模问题,9.数仓建模过程1.建模锯齿 建模锯齿是指在建模过程中的一种常见的效应,其中模型的输出可能会产生锯齿状的波动。这种效应通常是由于模型的不稳定性或过度拟合导致的。 在建模过程中,锯齿可能会使模型的表现变差,并且在预测新数据时也可能出现不一致的结果。因此,在建模时需要注意避免出现锯齿状的波动。 一种常用的方法是使用正则化来限
主要内容:1.数仓高内聚低耦合,2.多重粒度,3.如何提高查询效率,4.数仓数据域划分几种方式,5.粒度操作,6.SQL实现,7.数仓中ODS层命中多少为合理,8.数仓价值链的体现和实现,9.建立数仓的步骤,10.指标生命周期的评估,11.数据治理,12.数仓的目的1.数仓高内聚低耦合 一般复杂的公共逻辑可以采用抽象类和抽象方法的方式下沉到共有模块中,然后由相关子类去实现抽象方法,来实现不同的功能。这样可以将复杂的逻辑拆分成各个子类,使得类之间的耦合度降低,提高代码的可维护性。 2.多重粒度 在
主要内容:1.数仓构建,2.数仓最重要的是什么,3.如何保证数据的准确性,4.如何做数据治理?数据资产管理呢,5.如何控制数据质量,6.元数据的理解?元数据管理系统,7.数仓如何分层的?及每一层的作用,8.为什么要分层1.数仓构建 1). 前期业务调研 需求调研 数据调研 技术选型 2). 提炼业务模型,总线矩阵,划分主题域; 3). 定制规范 命名规范、开发规范、流程规范 4). 数仓架构分层:一般分为操作数据层(ODS)、公共维度模型层(CDM)和应用数据层(ADS),其中公共维度模型层包括
主要内容:1、什么是数据仓库?,2、数据仓库和数据库的区别?,3、如何构建数据仓库?,4、什么是数据中台?,5、数据中台、数据仓库、大数据平台、数据湖的关键区别是什么?,6、大数据有哪些相关的系统?,7、如何建设数据中台?,8、数据仓库最重要的是什么?,9、概念模型、逻辑模型、物理模型分别介绍一下?,10、SCD常用的处理方式有哪些?,11、怎么理解元数据?,12、数仓如何确定主题域?,13、如何控制数据质量?,,,,1、什么是数据仓库? 权威定义:数据仓库是一个面向主题的、集成的、相对稳定的、
25min 1.自我介绍 2.讲一下本科专业和研究生专业,分别学了啥 3.讲项目 4.Java主流框架讲一下 5.两个项目讲一下,团队怎么分工的,有没有移动端用户使用 6.对宁德时代的看法 7.讲专利,的创新点 8.个人优缺点 9.职业规划 10.反问 #宁德时代#
一面20min [项目]- [ ] 客户端怎么写的 [ ] 多台PC怎么连 [ ] 10000个客户端,怎么知道谁在线 [ ] 500个用户同时响应,怎么处理 [ ] 用户退出怎么操作 [ ] Nginx配置信息 [ ] 上传文件的断点续传怎么操作 [ ] MySQL和Redis的熟练度 [ ] 高负载的测试,有几台服务器 [ ] QT信号槽 [ ] QT按键怎么对应上函数 [ ] 为什么用QT不
Java 说一下 Java 有哪些基本数据类型 为什么要把 String 设计为不可继承 StringBuilder 和 StringBuffer 有什么区别 在开发过程中,如果对线程没有任何考虑,尽量是使用 StringBuilder 还是 StringBuffer 呢 简单说下通过反射创建对象的方式 抽象类和接口有什么异同点 接口的 default 方法可以是私有方法吗 操作系统 死锁产生的条
介绍项目20min 关系数据库和数仓有什么区别 数据集市、数仓、数据湖区别 数仓建模维度以及常用方法 举例说明三范式关系 介绍Hadoop工作流程以及常用组件 数据结构和算法太菜就没深入问 最后反问 总结:总面试流程不到四十分钟,面试官人很好,给了一些建议。 转行太难了!
1.自我介绍 2.数据库语言,DDL,DQL,DML... 3.考察数据库语言,建表,更改等 4.事务的四大特性 5.利用session模拟读已提交(完蛋,一点都不会) 6.对隔离的理解 7.项目中你如何进行测试,自己的项目 8.使用什么进行测试的,Jmeter 9.Jmeter怎么进行并发的检测,设置线程数(问性能测试) 10.linux的基本命令 11.软件测试模型VW 12.熟悉python
23.5.30快手一面 1、介绍项目 这里都根据个人项目去聊的,问了很久 2.数据怎么来的(ods层数据同步问题)ads层下游怎么做,数据怎么来的报表直接查的ads层吗 数据抓过来存在哪 3.hadoop了解吗hdfs有那些组件, 4.聊聊mapreduce进行几次排序 一个sql题,按分数进行排序 count(*) count(1) count(col)三者有什么区别 数据倾斜 pv值 23.5
CTO(现爱橙科技)- 外部数据 暑期实习 一面 自我介绍 实习做了哪些工作,介绍一下 在学校主要研究方向是什么,用的什么编程语言 python掌握得怎么样 juc 乐观锁,悲观锁 mysql哪些字段应该建索引 一张很大的表,如何优化查询效率 如果kafka数据丢失,可能是哪些原因 数据仓库分层讲一下 开放题:不限制条件,器材,方法,求解西湖的水有多少升?(一脸懵逼) 二面 自我介绍 数仓项目介绍
CTO-数据产品与技术部 暑期实习 一面 自我介绍 是保研的吗 实习做了哪些工作 为什么想做数据开发 研究生的方向 本科学过哪些计算机专业课 栈和队列的区别,应用场景 二叉树了解吗, 平衡二叉树了解吗 了解哪些排序算法, 分别说下原理和时间复杂度 快排的最差时间复杂度, 为什么,怎么优化 TCP三次握手, 为什么不是两次 MapReduce运行流程说一下 udf,udaf,udtf区别 spark
#面经# 面经太长只能分开写,如果对你的面试有帮助的话可以来主页看看面经。 一面时间是4.18 一面 1 自我介绍 2 问了一下专业相关度,然后介绍关于计算机之类的课程 3 怎么接触到iOS开发、学习方式、培训学员和开发项目是怎么个流程 4 先考的算法,没让手写代码 ▪反转链表 ▪怎么判断图是否存在环(没接触过图,但是我说了狄杰斯特拉算法) ▪怎么将一个链表的a到b的节点替换成另一个链表(双指针)
面经太长只能分开写,如果对你的面试有帮助的话可以来主页看看面经。 二面时间4.24 二面 1 算法题 ▪链表是否存在环,找到环的初始节点 ▪最长公共子序列II 2 自我介绍 3 我的专业属于电子信息类,介绍一些你学习过的课程 4 ViewController的生命周期(回答不全面,从创建到展示,布局子视图到消失) 5 性能优化你复习到哪些知识点 6 怎么判断卡顿(Runloop) 7 监控卡顿的工