主要内容:1.数仓高内聚低耦合,2.多重粒度,3.如何提高查询效率,4.数仓数据域划分几种方式,5.粒度操作,6.SQL实现,7.数仓中ODS层命中多少为合理,8.数仓价值链的体现和实现,9.建立数仓的步骤,10.指标生命周期的评估,11.数据治理,12.数仓的目的1.数仓高内聚低耦合 一般复杂的公共逻辑可以采用抽象类和抽象方法的方式下沉到共有模块中,然后由相关子类去实现抽象方法,来实现不同的功能。这样可以将复杂的逻辑拆分成各个子类,使得类之间的耦合度降低,提高代码的可维护性。 2.多重粒度 在
主要内容:1.数仓构建,2.数仓最重要的是什么,3.如何保证数据的准确性,4.如何做数据治理?数据资产管理呢,5.如何控制数据质量,6.元数据的理解?元数据管理系统,7.数仓如何分层的?及每一层的作用,8.为什么要分层1.数仓构建 1). 前期业务调研 需求调研 数据调研 技术选型 2). 提炼业务模型,总线矩阵,划分主题域; 3). 定制规范 命名规范、开发规范、流程规范 4). 数仓架构分层:一般分为操作数据层(ODS)、公共维度模型层(CDM)和应用数据层(ADS),其中公共维度模型层包括
主要内容:1、什么是数据仓库?,2、数据仓库和数据库的区别?,3、如何构建数据仓库?,4、什么是数据中台?,5、数据中台、数据仓库、大数据平台、数据湖的关键区别是什么?,6、大数据有哪些相关的系统?,7、如何建设数据中台?,8、数据仓库最重要的是什么?,9、概念模型、逻辑模型、物理模型分别介绍一下?,10、SCD常用的处理方式有哪些?,11、怎么理解元数据?,12、数仓如何确定主题域?,13、如何控制数据质量?,,,,1、什么是数据仓库? 权威定义:数据仓库是一个面向主题的、集成的、相对稳定的、
记录下最近虾皮 Shopee UI/UX 设计的面试经验,这个岗位是 hr 主动来找到我电话沟通咨询是否有意向投递的,投递后很快通过了简历筛选,技术面总共有三轮,第一轮结束后会需要完成一份笔试题目,然后进入第二轮,但由于在第二轮的时候聊得不太同频道,所以面经里只包含了第一二轮遇到的面试问题啦,全程中文。 部分高频出现的问题: 1、自我介绍 2、用户研究能力(后续了解到因为他们团队没有细分的 res
了解大数据吗? 分布式是什么? 1、list、set、map之间的区别与联系 2、arraylist和linkedlist之间的区别与联系 3、数组与链表的区别 4、线程和进程的区别?为什么要设置线程? 5、线程安全如何保证?几种方法?为什么会出现线程不安全 6、线程池用于干啥? 7、同步与异步的概念? SQL相关 1、讲一下索引?索引怎么实现 2、列排序是什么数据结构? 3、B树和B+树的区别?
岗位:项目管理-运营实习生 状态:大概凉了 过程: 自我介绍 为什么不找你专业相关的工作? 为什么学习与你专业不相关的数据分析和python? 出了一道题:如果让你一个月内上线10000道试题,你会怎么做?(考察沟通能力和逻辑思维能力) 自己回答情况:别的都还好,问的那道题自己回答的逻辑思维混乱,沟通表达不是很清晰 95%的概率凉了,但是那个岗位我真的好想去,那个岗位主要包含三方面:数据分析,跨部
已经hr面后一周多了,记录一下讯飞的面经,实话说,讯飞真的是俺面试公司里体验最好的,可惜流程也是真的久,希望能拿到offer吧 一面45分钟左右: 为啥想做测试 了解过测试工程师需要的工作技能吗 说一下实习中遇到的问题 实习工作的算法准确率是如何获得的 了解过工程化吗,比如将模型构造为服务提供外界访问 对模型实现并发访问有了解吗 实习中通过什么方式实现的抽帧 视频的分辨率、码率了解什么意思 个人倾
视频ms 前三分钟 自我介绍 数据仓库的了解 怎样设计数据分层 了解的大数据组件 spark用于解决什么问题 spark底层逻辑 sql的join实现方式 举例A(3) join B (5) 有几条数据 join底层逻辑 sql题 查询用户峰值 全程不到30分钟 **我就是一个小菜鸡。问就是面试凉凉 问的其实感觉没有特别难 但就是啥都不会。还是学的太过浅层次。总的来说 项目拷打 底层深挖。G
记录下最近虾皮 Shopee UI/UX 设计的面试经验,这个岗位是 hr 主动来找到我电话沟通咨询是否有意向投递的,投递后很快通过了简历筛选,技术面总共有三轮,第一轮结束后会需要完成一份笔试题目,然后进入第二轮,但由于在第二轮的时候聊得不太同频道,所以面经里只包含了第一二轮遇到的面试问题啦,全程中文。 部分高频出现的问题: 1、自我介绍 2、用户研究能力(后续了解到因为他们团队没有细分的 res
7.24一面,40min 1. 自我介绍 2. 为什么选择pm 3. pm有哪些品质技能 4. 你做pm的优势 5. 你做pm的不足 6. 实习中团队跨团队合作的案例 7. 调研文档例子,是怎么调研的 8. 调研中有没有印象很深刻的内容 9. 校园到职场的转变 10. 为什么想加入讯飞,想获得什么得到什么 8.31二面 1. 自我介绍 2. 在**公司做的主要是什么 3. 你整个调研下来之后主要的
一面: 实习 论文 常见分类算法 svn怎么实现分类的 集成学习 java基本数据类型 重写重载区别 浅拷贝和深拷贝区别 反射 多线程实现方式 如何创建线程池 软件测试的流程 测试一个输入法设计功能测试用例 常见Linux命令 二面: 实习(问的好详细) 论文 bug提交包含哪些要素 如何学习一个新知识 讲一个有成就感的事情 如何保证线程互斥 TCP/UDP区别 安全性从哪些方面测试 测试售卖机测
📍先简单自我介绍一下 本硕985 |非科班算法|kaggle一金一银|暑期斩获5个大厂offer|秋招大厂、银行、国企、 选调均有上岸 未来会在这里分享自己秋招一整年的经验感悟,希望对大家有所帮助! 上期分享了技术岗面试中需要注意的细节,本期介绍一下产品经理面试中最频繁被问到的五个问题 问题一:如何深挖自己的实习经历? 问题二:为什么适合做产品经理? 问题三:和研发在需求上出现矛盾怎么解决? 问
1、 确认专业,保研,成绩,排名 2、 课程内容,研究生课程等 3、 数据库底层索引的优劣势? 4、 我现在有一张表把所有字段都加索引了,这样好吗? 5、 存储过程和视图? 6、 视图字段是单独存储的吗? 7、 MR原理用你自己话简单描述。 8、 MR中数据倾斜的产生情况,你如何解决? 9、 一个复杂的SQL中发生了数据倾斜,你怎么确定是哪个group by还是join发生的? 10、 count
1、 是找大数据还是算法? 2、 对大数据领域的了解? 3、 从0-1建设数仓,你怎么做? 4、 数仓建设规范,依据? 5、 没想一块去,他想问建模思想之类的。维度、范式 6、 会哪些技术栈? 7、 Hadoop讲讲吧? 8、 为什么要有Hive,Hive作用? 9、 详细讲讲MR? 10、 数据倾斜发生的位置? 11、 Combiner了解吗? 12、 什么情况下不能用Combiner? 13、
1、 在XX实习,目前没有offer吗? 2、 实习和你项目的区别、实习项目主要做的内容? 3、 实习的难点? 4、 系统主要做的什么? 5、 讲讲MR? 6、 数据倾斜遇到过吗? 7、 除了null值呢? 8、 除了随机打散还有别的方案解决吗?