1.自我介绍 2.说一下数据库范式 3.说一下Hbase 4.Hbase的rowkey怎么设计的 5.说一下Clickhouse 6.说一下你了解的数据库底层的一些知识 7.数仓为什么这样分层 8.数据表和数据视图的区别 9.实习 数仓让你觉得有成就感的地方 10.你对离线感兴趣还是对实时感兴趣 11.你知道OLAP数据库都有哪些 12.Sql题 13.Hive Spark优化掌握的怎么样? 14
新手入门 - 开发者数据合规与安全承诺书 开发者数据合规与安全承诺书 尊敬的百度统计平台, 为合法合规地使用百度统计产品,我方在使用过程中承诺遵守如下规定: 一、严禁利用百度统计产品传播含有下列内容的信息: 反对宪法所确定的基本原则的; 危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的; 损坏国家荣誉和利益的; 煽动民族仇恨、民族歧视,破坏民族团结的; 破坏国家民族宗教政策,宣扬邪教和封建
#校招##秋招#
根本没想到会进面,笔试算法题全空,突然约面啥都没准备,本来已经放弃Java开始投非技术岗了。自我介绍的时候提前说了我Java是自学的几个月速成的,所以面试官问的都非常基础。 1 JVM内存结构 2 双亲委派 3 Java的常见集合 4 线程安全的集合 5 HashMap的实现以及并发下线程安全问题 6 是否用过Redis集群(无,直接跳过了) 7 Redis的持久化 8 与数据库的数据一致性问题
自我介绍后根据我的项目问我了一些问题,虚拟列表,懒加载,canvas怎么压缩的(这个没答对) 项目怎么实现鉴权的,我说的jwt,巴拉巴拉 然后又问了cookie, 问了防抖节流 项目跨域是怎么解决的(项目上线后用反向代理不太好) 问了数据类型,然后就问深拷贝浅拷贝,让我实现深拷贝 问promise,让我实现all和race方法 解释下事件循环机制 nextTick 总结:还是要多写写底层源码,回答
9.8 一面(30min) 介绍下自己的项目,项目的内容和使用的技术栈 细挖离线数仓项目 mysql三范式 hive内部表和外部表 hive数据倾斜 一道sql题 9.11 二面(30min) 两张亿级大表join有什么优化方案 场景题:公司通过银行给员工发工资,银行要完成公司账户的扣款和员工账户的收款,这个场景要如何设计,要考虑哪些问题? 介绍下离线数仓项目,几个人完成,多久完成,有哪些难点,现
一面 面试官会一步一步引导, 也会给出自己的见解,体验很好 简单介绍一下自己 接口优化,讲讲背景,怎么做的 八张表同时并发去查的话,会不会对数据库的压力很大,有没有考虑这方面?数据库的负载怎么样? 什么情况会导致索引失效?索引命中的原理? select .... where b = xx and c = xx 会命中索引吗,怎么优化这个问题? 有个字段叫city,你觉得用city建索引合适吗 用单
秋招第一个意向 感恩团子! 二面和hr面感觉自己发挥得并不是很好,一度以为凉了... timeline: 两次笔试都a四道多一丁点。 8.29 一面 8.31 二面 9.5 hr面 9.7 意向 一面 60min: jvm了解哪些 垃圾回收了解哪些 主线程和另外十个线程,怎样使主线程最后执行完毕 (join、await) flink checkpoint kafka有序和不丢如何保证 算法题 链表
快手二面(已挂): 两道算法题: 1. topk 快排以及快排的优化 2. 二叉树最大路径和 flink相关的一些题 其他忘了... 饿了么二面(已挂): 介绍下实验室的项目 简历上的实时数仓项目 平时学习方式是什么? 你有哪些主动走出舒适区的经历? 你的优点/缺点有哪些?为改正自己的缺点做过哪些努力? 你受过最大的挫折和困难是什么? 你有哪些有成就感的经历? 你选择岗位和公司有哪些考虑?
1. 自我介绍 2. 科大讯飞比赛做了什么,是用到了讯飞平台的某些功能吗 3. API开放平台详细介绍一下 4. 但是你做的这个接口调用具体收益,作用是干嘛的呢 5. 接口调用高并发情况时用户使用延迟之间如何进行优化 6. 用户访问时的延迟黑洞是什么,如何优化 7. 软引用、弱引用分别是什么 8. 如何提升系统的处理能力,如何优化 9. 手撕: 1. 多线程去查询数据库,并将查询结果放入List<
一、选择题 总计20道 408内容+大数据框架(Hadoop、Spark、Flink等) 有单选,也有多选 二、编程题 第一题:小红书推荐系统 统计热点词频;输入一个字符串,统计词频后,按照词频从高到低打印热搜单词(出现次数超过3,同时对于两个词频相同的单词,要按单词字典序打印 public static void main(String[] args) { Scanner sc = n
最近面试强度上来了...两天四场 饿了么一面(40min): 介绍下实时项目 对DWD和DIM层的理解,构建过程(背了套理论,面试官听笑了..) 开发DWS层的目的(避免重复建设,数据一致性) Hive倾斜优化 kafka底层数据存储(log文件分段,稀疏索引,mmap,零拷贝) flink状态 flink checkpoint作用 一道sql题 没实习被diss了,面试官说做数仓的话更看重对业务
1.问项目 2.数据倾斜,spark,hive,问的比较多。大多是简单的八股 3.问java很多(没复习,哭死) ①java的多态是怎么实现的、 ②java泛型了解吗 ③java反射了解吗 ④java垃圾清理机制是什么 ⑤java多线程了解吗 直接一问三不知 4.sql现场写代码
1、自我介绍 2、实习经历介绍 3、实习项目难点介绍 4、你比别人的优势是什么 5、hive相比与传统数据库的优势是什么 6、hive集成了mapreduce,如何将hive语句转换为mapreduce 7、hive on spark和spark on hive的区别 8、spark调优你做过哪些? 9、数据倾斜调参和不调参的方法你知道有哪些 10、数仓的存储介质有哪些 11、数仓建模的话你会如何
京东零售,从后端调剂到大数据,hr之前说的不会问大数据,也确实没问,但是不妨碍我拉了一泡大的 1.自我介绍 2.写题-搜索螺旋排序数组(两个月没写过lc了,大汗淋漓,之后还是没写出来) 3.常见的排序算法,时间复杂度,空间复杂度 4.synchronized关键字的使用 5.volatile关键字,和synchronized的区别 6.Java的内存回收怎么做的 7.hashmap和treemap