7.15一面: 1.自我介绍 2.项目深挖(聊了很久) 3.对数仓的看法 4.主题域及其建设过程(要落地,谈业务过程) 5.讲一个熟悉的指标体系构建(没做过) 6.为什么不考研 7.为什么想跳槽 8.sql留存率(讲了下思路就行了) 反问: 1.为啥晚上6点还面试,唯品会不是955吗 2.唯品会的计算引擎选型是什么 ------------------------- 挂了
1、flume架构组成以及作用 2、flume到kafka中,如何保证同一个组件的数据放在kafka同一个分区里面 3、kafka支持全局有序吗?kafka isr?介绍kafka副本与hdfs副本区别 4、zookeeper在项目中的作用?如何判断节点是否存活? 5、HDFS什么功能用到了zookeeper? 6、spark的执行流程,比如做一个wordcount 7、sparkcontext内
一面 聊实习 数仓怎么分层 为什么要分层 sql 连续登录天数最多的用户 窗口和聚合函数的区别 mr和spark对比 还有些问题不记得了 应该寄了,莫名紧张,发挥太差了 #面经##滴滴#
5/5一面 5/14 二面 5/18 hr面 5/19 OC 一面(1h10min) 1.自我介绍一下 2.介绍一下你的项目 2.1 Mysql全量数据规模 2.2 既然Mysql能存储,为什么要导入到hive中 3.说一下MySQL的ACID特性 4.脏读和幻读分别是什么含义 5.spark持久化的级别和作用 6.spark任务出现数据倾斜有哪些方法解决 7.hive没办法创建分区怎么理
部门:网易云 8.23约面,8.25 一面 8.29 二面。8.30 hr面 一面: 45min左右 1.自我介绍 2.说说项目用到了哪些技术 3.你刚刚说到了即席查询,项目里是怎么做的。 4.四道sql,十分钟后对答案 5.笛卡尔积了解吗。 6.笛卡尔积会产生什么问题。 7.你刚刚说到了数据倾斜。介绍一下。 8.笛卡尔积就会产生数据倾斜吗 9.mr流程介绍一下 10.你多久能来实习 11.你刚刚
自我介绍 问对hadoop各个组件的了解 解释下mapreduce的过程 问有没看过谷歌的GFS论文 问项目里数据库咋建模设计的 对维度建模的了解 对数仓的了解,数仓一般咋分层 GGGG,这之前只关注框架底层了,,没看过数仓的东西#大数据开发面经##实习生[话题]##access#
首先做了三道SQL题,主要涉及分组聚合、窗口函数。 3.3 一面 28min: 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min: 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran
时长:1h 由于问题太多,分四类进行整理 0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式 1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验,求个好运 时长一个小时二十分钟 自我介绍 因为学统计的,问了中心极限定理和大数据定律 机器学习-XGBoost算法简介 两道智力题:逻辑判断谁说谎了和分金条 问了为什么研究生跨专业保研了? Hive和MySQL区别 数据库的索引有什么用 说一下索引的类型,还有B+树索引 数据仓库和关系型数据库区别 Hadoop生态圈简介 问我SQL写的
#校招##秋招#
自我介绍后根据我的项目问我了一些问题,虚拟列表,懒加载,canvas怎么压缩的(这个没答对) 项目怎么实现鉴权的,我说的jwt,巴拉巴拉 然后又问了cookie, 问了防抖节流 项目跨域是怎么解决的(项目上线后用反向代理不太好) 问了数据类型,然后就问深拷贝浅拷贝,让我实现深拷贝 问promise,让我实现all和race方法 解释下事件循环机制 nextTick 总结:还是要多写写底层源码,回答
一面 面试官会一步一步引导, 也会给出自己的见解,体验很好 简单介绍一下自己 接口优化,讲讲背景,怎么做的 八张表同时并发去查的话,会不会对数据库的压力很大,有没有考虑这方面?数据库的负载怎么样? 什么情况会导致索引失效?索引命中的原理? select .... where b = xx and c = xx 会命中索引吗,怎么优化这个问题? 有个字段叫city,你觉得用city建索引合适吗 用单
1.问项目 2.数据倾斜,spark,hive,问的比较多。大多是简单的八股 3.问java很多(没复习,哭死) ①java的多态是怎么实现的、 ②java泛型了解吗 ③java反射了解吗 ④java垃圾清理机制是什么 ⑤java多线程了解吗 直接一问三不知 4.sql现场写代码
一面 实习深挖 对于高耗时任务的代码优化思路 如何发现不必要的扫表 sparksql和hivesql有什么区别 sparksql和hive on spark性能有差异吗,差异在哪 hdfs架构 datanode心跳机制 datanode挂了之后会怎么样,容错机制是怎么样 机架感知 有限内存下的一亿数据怎么排序 了解哪些shell命令 有a,b两个文件,存的都是id,写shell找出a中有但b中没有
#牛客解忧铺##牛客在线求职答疑中心##你觉得今年春招回暖了吗##面经##大数据开发# 附加信息:211本+985硕(非计算机),笔试4出头的分数,面了90分钟,面试官人超好,奈何本人过菜 1、部门介绍 2、自我介绍 3、项目介绍,在项目中承担什么角色,如何完成工作 大数据相关: 4、对大数据开发的理解 5、知道什么常用的大数据开发组件 6、谈谈MapReduce的原理 7、谈谈shuffle的实