1.去公司线下面试,有笔试题 1.填资料,个人信息,以及有关职业发展问题 1.比如,你的缺点和优点是什么,对你个人产生怎样的影响? 2.如果你和他人有不同的观点,你该如何和他人讨论? 等等,基本就是情商面 笔试题 1.中科软是一家主做保险的外包公司,所以用到的sql主要是oracle, 选择题有几道oracle的题, 2.然后有简答题,也比较简单 面试环节 1.自我介绍 2.对于shell部分的提
处女面,很紧张 1. 问项目 2. 项目中为什么使用kafka作为缓冲队列。 3. mapreduce原理。 4. 如果mapreduce发生数据倾斜该如何解决。 5. 解释一下列式存储、列式存储的文件格式。 6. 星型模型、雪花模型、星座模型的区别和应用场景。 7. 拉链表是什么、一般解决什么问题。 8. 什么是指标体系、如何明确指标体系。 9. zookeeper、datax等(项目上写的组件
9.21号下午一面的,忘记发牛客了,现在补上 一个年轻并且非常友好的面试官,沟通也比较顺畅,完全按照我的简历一条条过,八股很少,问也只会问涉及项目的八股 - 介绍实习部门的业务,数仓架构 - 以下内容都是我简历具体的内容,可能没啥参考意义,中间穿插的一些细节问题有点忘了: - Cube表性能优化,还有其他优化的方法吗 - 表分桶优化,一般表关联还能怎么优化 - 小文件治理 - SLA治理 - 数据
25、MR工作原理 Input Spliting:输入的数据被拆分成更小数据块(Input Splits:将大文件切割成适合并行处理的小块数据,每个小块数据称为一个分片,一个分片作为MR处理的基本单元)Mapping:mapper节点将分配到数据块执行map操作,产生中间结果(k,v)键值对并写入到本地磁盘Shuffling and Sorting:Mapper节点会根据Key进行排序,并将相同K
主要问经历,问项目的比较多 hdfs的角色有哪些,功能 hdfs的写流程 Java的线程安全是什么 最熟悉的集合是什么?详细描述一下 Arraylist为什么长度可变 python的装饰器用过没?是什么东西? 手撕python编程题,给定一段字符串,统计出每个单词的频率,频率相同的按降序排序 外部表和内部表的区别? 为什么选择多益? 对游戏的流失人数进行分析? 有没有拿到其他公司的OFFER
1.自我介绍 2.实习技术难点 3.项目技术难点 4.id timestamp 位置 三个字段完全一样的去重,sql怎么做scala怎么做 挑选同个人最后一个时间戳的记录,sql怎么做scala怎么做 5.spark submit提交参数 6.内存/并行度参数优化方案和技巧 7.当出现数据倾斜的时候怎么排查,怎么处理 不能只提八股,要完善分情况的答 8.两数之和 9.小数之和 10.反问,写sca
一面 聊项目 2道sql lead/lag函数 like pandas基础 数据倾斜问题 二面 聊项目 表连接方式 数仓各层作用 数仓建模类型有哪些 维度模型有哪几种 sql执行计划 mr过程 数学建模怎么分工 为什么不读研 数据中台产品了解哪些 已oc #面经#
是脉脉这个公司的面试,不是脉脉上投的公司的面试。 虽然没想去,但我感觉也没资格去 面试官一直在说不做评价,不做评价,懂我意思吧。 问了java、jvm、scala偏函数 大数据问了kafka选举流程;yarn调度器;zk。哪不熟问哪,反其道而行。 偏底层组件开发,我可能偏数仓吧,技术力还没到这个程度。问的有点怀疑人生 面试官结束直接告诉我今天到这了,我说问问题呢问问题,他说理论上实习生没有提问环节
1. 维度建模和范式建模是什么,两者之间比较大的区别。 2. 为什么说维度建模可以故意引入数据冗余,而范式建模要避免数据冗余,它们这样做的目的是什么? 3. 两道Sql题。 order_info ( order_id bigint, -- 订单id city_name string, -- 城市名 driver_id bigint, -- 司机id passenger_id bigint, --
1. 自我介绍 2. 讲解一下项目 3. 项目中数仓为什么要这样分层。 4. 关于数模比赛项目的问题。xxx 5. 写sql题。 用户访问日志:user_id, device_id, date 求1. 给定时间2024-06-17 用户、设备的数量,都有重复值,都有可能为空 第一次写法: select count(distinct user_id) user_cnt count(distinct
26届Java选手,面了很多大厂后端实习基本都挂了,稀里糊涂接了大数据的实习,总体比较顺利,先去沉淀了 9.27 美团数开一面 30min 介绍一个项目 项目中的难点 sql 求每月最大和最少的订单数量 二分查找 面完10分钟打电话约二面 9.30 美团数开二面 50min 介绍两个项目 MySQL 索引 介绍一下Hadoop HDFS有几个个副本,为什么 深挖Shuffle原理 sql 面试官自
写这篇帖子就是为了回馈广大牛友。 美团一志愿投的后端开发,没人捞流程自动结束,二志愿开启后迅速约面。 Timeline 3.29一面 4.3二面 4.8 offer 因为人在海外,hr打不通电话,因此直接就发offer到邮箱了。 面经 这里就写几个在众多面试中比较让我印象深刻的问题吧。 1. 对于一个电影,怎么设计数据库中的表,怎么加索引?如果用户搜索很复杂,比如可能任何字段都想搜到电影相关信息,
一面: 1.拷打项目 2.拷打实习 3.sql top n 面试官应该不是数仓的,应该是偏向平台开发那边,所以没问八股 二面(5.13) 已OC
离线数仓项目介绍 hdfs读流程 hdfs 中datanode怎么与namenode交互 mr过程 hive数据倾斜,介绍原因和解决方案 介绍一下网络结构,tcp在哪一层 java有哪些集合类 介绍java接口 MySQL索引 数据结构(B+树) 反问 上海银行数仓技术框架
2024.1.9 面试 Boss直聘沟通 公司要求驻场开发,接受加班,接受出差 你是25届是吧?能在六个月左右是吗?目前在校吗? 后续有什么规划? 你怎么理解数据开发这个岗位的? 讲讲简历上这两个项目?是你在学校做的是吧? 项目你是全程参与是吧? 聊天这个项目的数据源是哪里来的呀? 项目整体是落在HDFS上是吧? 单一架构,嗷,然后可视化,是哇? 下一个电商项目介绍一下? 数据来源讲讲? 那意思是