23.9.21 广立微 共计半小时 在阿里做的项目介绍一下 充电场站项目。。。 用户画像项目详细介绍 java大数据去重的方法 python数据清洗用的什么方法 你们阿里的数据中台中表是以什么格式存储的 模型的评级标准是什么样的 python直接取一行数据 hive窗口函数,一个省一个市,取人口最多的两个城市 hive的行转列和列转行用什么函数 lead和lag是干什么的 mysql不同的关键字的
介绍项目,细问了一些项目中的知识点 spark RDD宽窄依赖 sql编程汇率换算 python二维数组查找数据 mysql hbase比较 hbase行列存储 mysql能否直接查数据中某一列的特定数据,hbase能不能(这块问的我没太听明白) mysql两种表引擎 对事务有什么理解,举个例子 大数据协同算法,保持一致性举几个算法例子 有什么要反问的 大概就是这些问题可能差一两道忘了,hbase
粉丝投稿,两年数据开发经验,面试博时基金的数据开发岗位。 开局是亘古不变的自我介绍,和面试官寒暄几句就开始面试了。 1、能简单介绍下你们的组织架构? 2、你们数据相关的都有什么系统? 3、你们团队有多少人? 4、数仓的数据量多大? 5、除了o层,数仓有多少任务? 6、数仓的任务要跑多久? 7、外部数据平台数据的流向? 8、外部数据平台有哪些数据入到数仓? 9、数据交换平台的应用场景? 10、你们大
一面(技术面)1小时 自我介绍; 介绍一下实习; Flink数据倾斜的原因? Flink如何保证数据不丢失? 介绍一下数据流和数仓架构? 解释一下被压? 介绍一下CheckPoint机制? 团队的工作和你的工作? 什么是AB测试? 现在的架构是什么? 如何保证实验层之间的正交? 产出的核心指标是什么? 实验的显著性如何计算? 实验的合规问题? 合规改造问题的设计思路? 二面(综合面)45分钟 自我
本人24届某211大数据专业,字节也是本人的第一个面试。 首先是一个自我介绍, 然后问了项目的东西, 比如用的是维度建模嘛,用了什么事实表,用了什么业务,事实表有哪几种分类 项目中的数据域是怎么划分的。 然后问了MapReduce的执行流程,问了一个Map阶段的数据切分函数(没答上来),又问了MapReduce可以不要map嘛。 接着问了spark,问了spark和Hadoop有什么区别。 hiv
9.14一面 数仓维度建模 离线数仓和在线数仓的构建流程 MapReduce过程 三道编程题: java无重复字符的最长字串(我实习也撕这个) 行列转换(一行变为多行,用mysql,不会。。。) 窗口函数序号函数三个(简单) 问我有没有收到其他公司的offer 将近1h,居然过了,我以为我挂了 9.21二面 这个面试官感觉说话慢悠悠的,然后不怎么问问题,我觉得是KPI来着 项目经历 实习经历 数仓
Timeline: 9.15 投递 9.25 一面 9.25 一面 53min: 1.常见数据结构 2.TCP三次握手 四次挥手 3.Java基本数据类型 包装类型 4.==和equal的区别 5.面向对象三大特性 6.Hashcode方法怎么用 7.String stringbuilder stringbuffer 区别 8.泛型 反射 集合 9.Arraylist和linkedlist异同 1
1,自我介绍。 2,两端实习经历详细讲讲。 3,事务的隔离级别。 4,sql中文乱码,怎么解决,更改编码的命令。 5,sql中日志相关。 6,查询内外连接,查询优化。 7,反问。 8,是否接受调剂?是否了解银行和子公司?
一面 1.自我介绍 2.介绍下实习的内容 3.介绍一个项目:深挖,包括技术栈、背景、目的 4.spark的内容怎么学习的 5.数据倾斜遇到过吗?怎么处理?产生原因? 6.t检验与z检验的区别? 二面 很快约二面后 因为面试撞了往后调(!!最好不要随意换时间) 1.自我介绍 2.从背景、个人责任、成果三个部分介绍一个项目 3.统计学知识 4.常用的机器学习方法?怎么学习的? 5.实习情况,有无转正.
# 一面9.8 自我介绍 离线项目用到什么架构 实习使用的是什么开发语言 实习做的是哪一层的开发 阿里数仓分层是怎么做的 Mysql的索引是用的什么 为什么用B+树索引 一条语句select from where group by having在mysql中执行顺序是什么 mapreduce的执行过程 hive分区表和分桶表的区别 数据倾斜有哪些是怎么处理的 给题说思路 1. 统计主键出现次数 2
Timeline: 9.1 投递 9.14 笔试 9.25 一面 11.1 二面 技术+HR面 9.25 一面 23min: 1.项目经历 2.数仓分层 3.数仓执行引擎 4.Sql关键字执行顺序 5.Mysql索引引擎 6.Innodb和myisam区别 7.Flink基本算子 8.Map和flatmap 9.Keyby 10.数据倾斜 怎么定位 11.Hive分区表和非分区表 12.增加或删
26届Java选手,面了很多大厂后端实习基本都挂了,稀里糊涂接了大数据的实习,总体比较顺利,先去沉淀了 9.27 美团数开一面 30min 介绍一个项目 项目中的难点 sql 求每月最大和最少的订单数量 二分查找 面完10分钟打电话约二面 9.30 美团数开二面 50min 介绍两个项目 MySQL 索引 介绍一下Hadoop HDFS有几个个副本,为什么 深挖Shuffle原理 sql 面试官自
一面: 1.拷打项目 2.拷打实习 3.sql top n 面试官应该不是数仓的,应该是偏向平台开发那边,所以没问八股 二面(5.13) 已OC
笔试 90min 选择题+sql*1+算法*2 简单sql,困难算法 一面 共 50min 自我介绍 sql 3小问 15min 实习经历 项目经历 数仓分层的意义 从hdfs如何到ODS层 介绍维度表和事实表 有没有使用zookeeper hadoop节点之间如何进行联系 hive sql脚本是在哪里运行 一共有多少张表,都是自己写的吗 做数仓的时候遇到了哪些困难,怎么解决的 在实习期间的困难和
30min 1. 自我介绍 2. 为什么走大数据 3. 项目介绍 4. hive和spark的区别 5. MR和spark有哪些区别,分别适用什么场景 6. 为什么不选择spark做离线 7. 开窗函数有哪些 8. 数仓怎么设计的 9. ODS层存在的意义 10. DWD和DIM怎么设计的,有什么指标 11. DWS层存放的哪些指标 12. 下一步准备学习什么?怎么学习? 反问 1. 部门做什么业