笔试时间 90min 20道选择题 + 3道编程题 主要还是考数据库的操作 如何增删查改 如何检索 然后阅读数据库代码 找错误/模拟运行 只有一道算法题 是AcWing_3578题 的变式 个人感觉算是降低难度 每次操作选取两个数 ai 与 aj, 并赋值ai = ai + aj, 删除aj; 中位数计算方式为为(m+1)/2向下取整。 输入第一行数据组数t 此后每组 第一行数组长度n 操作k数
首先做了三道SQL题,主要涉及分组聚合、窗口函数。 3.3 一面 28min: 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min: 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran
时长:1h 由于问题太多,分四类进行整理 0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式 1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);
总共33min,凉透了,可能因为我是第一次面试,没经验,被面试官牵着鼻子走 1、数据仓库和数据库的区别 2、数仓的分层 3、维度建模的基本构成 4、了解缓慢变化维吗 5、说一下拉链表 6、用到了哪些用户指标作为算法的输入呢? 7、协同过滤的常用算法有了解吗? 8、Presto和Hive区别 9、Hivesql和sparksql区别 10、Sql:统计最近下单的用户是在去年12月份的用户数量 11、
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验,求个好运 时长一个小时二十分钟 自我介绍 因为学统计的,问了中心极限定理和大数据定律 机器学习-XGBoost算法简介 两道智力题:逻辑判断谁说谎了和分金条 问了为什么研究生跨专业保研了? Hive和MySQL区别 数据库的索引有什么用 说一下索引的类型,还有B+树索引 数据仓库和关系型数据库区别 Hadoop生态圈简介 问我SQL写的
新手入门 - 开发者数据合规与安全承诺书 开发者数据合规与安全承诺书 尊敬的百度统计平台, 为合法合规地使用百度统计产品,我方在使用过程中承诺遵守如下规定: 一、严禁利用百度统计产品传播含有下列内容的信息: 反对宪法所确定的基本原则的; 危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的; 损坏国家荣誉和利益的; 煽动民族仇恨、民族歧视,破坏民族团结的; 破坏国家民族宗教政策,宣扬邪教和封建
1.问项目 2.数据倾斜,spark,hive,问的比较多。大多是简单的八股 3.问java很多(没复习,哭死) ①java的多态是怎么实现的、 ②java泛型了解吗 ③java反射了解吗 ④java垃圾清理机制是什么 ⑤java多线程了解吗 直接一问三不知 4.sql现场写代码
#校招##秋招#
根本没想到会进面,笔试算法题全空,突然约面啥都没准备,本来已经放弃Java开始投非技术岗了。自我介绍的时候提前说了我Java是自学的几个月速成的,所以面试官问的都非常基础。 1 JVM内存结构 2 双亲委派 3 Java的常见集合 4 线程安全的集合 5 HashMap的实现以及并发下线程安全问题 6 是否用过Redis集群(无,直接跳过了) 7 Redis的持久化 8 与数据库的数据一致性问题
自我介绍后根据我的项目问我了一些问题,虚拟列表,懒加载,canvas怎么压缩的(这个没答对) 项目怎么实现鉴权的,我说的jwt,巴拉巴拉 然后又问了cookie, 问了防抖节流 项目跨域是怎么解决的(项目上线后用反向代理不太好) 问了数据类型,然后就问深拷贝浅拷贝,让我实现深拷贝 问promise,让我实现all和race方法 解释下事件循环机制 nextTick 总结:还是要多写写底层源码,回答
9.8 一面(30min) 介绍下自己的项目,项目的内容和使用的技术栈 细挖离线数仓项目 mysql三范式 hive内部表和外部表 hive数据倾斜 一道sql题 9.11 二面(30min) 两张亿级大表join有什么优化方案 场景题:公司通过银行给员工发工资,银行要完成公司账户的扣款和员工账户的收款,这个场景要如何设计,要考虑哪些问题? 介绍下离线数仓项目,几个人完成,多久完成,有哪些难点,现
一面 面试官会一步一步引导, 也会给出自己的见解,体验很好 简单介绍一下自己 接口优化,讲讲背景,怎么做的 八张表同时并发去查的话,会不会对数据库的压力很大,有没有考虑这方面?数据库的负载怎么样? 什么情况会导致索引失效?索引命中的原理? select .... where b = xx and c = xx 会命中索引吗,怎么优化这个问题? 有个字段叫city,你觉得用city建索引合适吗 用单
秋招第一个意向 感恩团子! 二面和hr面感觉自己发挥得并不是很好,一度以为凉了... timeline: 两次笔试都a四道多一丁点。 8.29 一面 8.31 二面 9.5 hr面 9.7 意向 一面 60min: jvm了解哪些 垃圾回收了解哪些 主线程和另外十个线程,怎样使主线程最后执行完毕 (join、await) flink checkpoint kafka有序和不丢如何保证 算法题 链表
快手二面(已挂): 两道算法题: 1. topk 快排以及快排的优化 2. 二叉树最大路径和 flink相关的一些题 其他忘了... 饿了么二面(已挂): 介绍下实验室的项目 简历上的实时数仓项目 平时学习方式是什么? 你有哪些主动走出舒适区的经历? 你的优点/缺点有哪些?为改正自己的缺点做过哪些努力? 你受过最大的挫折和困难是什么? 你有哪些有成就感的经历? 你选择岗位和公司有哪些考虑?
最近面试强度上来了...两天四场 饿了么一面(40min): 介绍下实时项目 对DWD和DIM层的理解,构建过程(背了套理论,面试官听笑了..) 开发DWS层的目的(避免重复建设,数据一致性) Hive倾斜优化 kafka底层数据存储(log文件分段,稀疏索引,mmap,零拷贝) flink状态 flink checkpoint作用 一道sql题 没实习被diss了,面试官说做数仓的话更看重对业务