10.10 一面 12min 明明写的数据开发,招的是数据挖掘..... 全问的算法,一个大数据的东西都没问 满满的槽点,邮件上写的面试时间20min,然后一直等,然后hr说是上一个人还没面完.....再怎么没面完也不会让人等超过20min吧,结果等了半个多小时.......还是3个专业面试官,面试就12min,明明写的是大数据开发岗,说我怎么经历都是数据开发......招的又是数据挖掘,直接单开
粉丝投稿,两年数据开发经验,面试博时基金的数据开发岗位。 开局是亘古不变的自我介绍,和面试官寒暄几句就开始面试了。 1、能简单介绍下你们的组织架构? 2、你们数据相关的都有什么系统? 3、你们团队有多少人? 4、数仓的数据量多大? 5、除了o层,数仓有多少任务? 6、数仓的任务要跑多久? 7、外部数据平台数据的流向? 8、外部数据平台有哪些数据入到数仓? 9、数据交换平台的应用场景? 10、你们大
一面(技术面)1小时 自我介绍; 介绍一下实习; Flink数据倾斜的原因? Flink如何保证数据不丢失? 介绍一下数据流和数仓架构? 解释一下被压? 介绍一下CheckPoint机制? 团队的工作和你的工作? 什么是AB测试? 现在的架构是什么? 如何保证实验层之间的正交? 产出的核心指标是什么? 实验的显著性如何计算? 实验的合规问题? 合规改造问题的设计思路? 二面(综合面)45分钟 自我
本人24届某211大数据专业,字节也是本人的第一个面试。 首先是一个自我介绍, 然后问了项目的东西, 比如用的是维度建模嘛,用了什么事实表,用了什么业务,事实表有哪几种分类 项目中的数据域是怎么划分的。 然后问了MapReduce的执行流程,问了一个Map阶段的数据切分函数(没答上来),又问了MapReduce可以不要map嘛。 接着问了spark,问了spark和Hadoop有什么区别。 hiv
题型:15道选择题,其中有单选和多选;3道编程题,核心代码模式,为了方便调试,本文提供ACM 笔试太难了?可以私信我 有些AC有些通过率还行,助攻已经进面了 在TCP/IP协议的传输层将数据传送给用户应用进程所使用的地址形式 A.端口号 B.socket地址 C.IP地址 D.MAC地址 多选 高并发测试中,数据库数据问题往往出现很多,下面关于隔离级别描述正确的是 A不可重复读:同个事务前后多
一面 4.6 视频面 本来说好视频面,差不多晚上8点打了个电话说电话面,聊了30分钟基本没怎么问技术问题。 二面 4.10 现下面,聊了10分钟天,面试官说他搞算法的,问了个技术问题clickhouse有什么可以代替,这题没答上来。G
9.14一面 数仓维度建模 离线数仓和在线数仓的构建流程 MapReduce过程 三道编程题: java无重复字符的最长字串(我实习也撕这个) 行列转换(一行变为多行,用mysql,不会。。。) 窗口函数序号函数三个(简单) 问我有没有收到其他公司的offer 将近1h,居然过了,我以为我挂了 9.21二面 这个面试官感觉说话慢悠悠的,然后不怎么问问题,我觉得是KPI来着 项目经历 实习经历 数仓
Timeline: 9.15 投递 9.25 一面 9.25 一面 53min: 1.常见数据结构 2.TCP三次握手 四次挥手 3.Java基本数据类型 包装类型 4.==和equal的区别 5.面向对象三大特性 6.Hashcode方法怎么用 7.String stringbuilder stringbuffer 区别 8.泛型 反射 集合 9.Arraylist和linkedlist异同 1
分享一下百川智能的笔试,对于校招生来说难度很大,我只做出来第二题,其余两题都没有什么思路。 笔试题 1 很久很久以前,有一个 NBA 球探,主要负责在大学联盟中,给球队寻找有潜力的年轻射手。现在他手里有非常多而且格式凌乱的新秀投篮数据,让球探不知如何选择,作为球探的助理,你需要给出一份符合要求的球员名单。要求如下: 在一个学期的大学比赛中,至少连续登场 5 次,并且每场比赛的前 5 次投篮的总分是
1.自我介绍 2.项目 3.svm能解决线性不可分吗 4.训练模型的时候loss不下降怎么解决 5.sql的join 6.a 123 b112 aleftjoinb得到什么 答的稀烂,寄了
1.自我介绍 2.介绍和数据相关的项目 3.深入探讨项目 4.左外连接(口述他提供的场景结果) 5.你的数据表中常用哪些索引 6.查询和索引是有关的吗 7.优化慢查询 explain 看哪些信息?实际操作过吗? 全程就是索引相关的问题,和看到的完全不一样,准备数仓的概念都没用到
1,自我介绍。 2,两端实习经历详细讲讲。 3,事务的隔离级别。 4,sql中文乱码,怎么解决,更改编码的命令。 5,sql中日志相关。 6,查询内外连接,查询优化。 7,反问。 8,是否接受调剂?是否了解银行和子公司?
一面 1.自我介绍 2.介绍下实习的内容 3.介绍一个项目:深挖,包括技术栈、背景、目的 4.spark的内容怎么学习的 5.数据倾斜遇到过吗?怎么处理?产生原因? 6.t检验与z检验的区别? 二面 很快约二面后 因为面试撞了往后调(!!最好不要随意换时间) 1.自我介绍 2.从背景、个人责任、成果三个部分介绍一个项目 3.统计学知识 4.常用的机器学习方法?怎么学习的? 5.实习情况,有无转正.
# 一面9.8 自我介绍 离线项目用到什么架构 实习使用的是什么开发语言 实习做的是哪一层的开发 阿里数仓分层是怎么做的 Mysql的索引是用的什么 为什么用B+树索引 一条语句select from where group by having在mysql中执行顺序是什么 mapreduce的执行过程 hive分区表和分桶表的区别 数据倾斜有哪些是怎么处理的 给题说思路 1. 统计主键出现次数 2
二面和一面很类似,完全不问八股文,也不让我sql,算法。 问实习经历,我说我在的部门偏业务,天天就是写sql,还有就是理解业务。 项目中的难点,感觉哪一块收获比较大,回答:刚刚的前一个月sql还有点难度,后面主要是对业务的理解。有不会的问题一定要敢问,不怕别人觉得自己是菜鸡,自己本来就是菜鸡,收获是增强了自己的沟通能力。 问了我对大数据组件相关的理解,就那些东西,hadoop,hive,spark