这个是之前的,面了有20多天了吧(maybe)感觉日子过得好快,都没有什么offer入账,不知道大家现在如何?发一发攒攒人品吧,offer快快来 自我介绍 问及之前的实习相关经历 人生最难过的一个阶段,如何从泥潭里爬出来的? 对快手有什么了解? 如果遇到需要非常细致且不能出错的数据,你会怎么办? SQL相关问题: 聚合窗口函数和聚合函数的区别 常见的连接方式有哪些? 通配符有哪些? #非技术面试记
中秋假期所以二面三面间隔了挺久的,9.23 三面,面试时间很短,35 分钟左右 - 自我介绍 - 实习介绍 - 看你做了很多任务优化,讲讲优化的思路,从哪些方面去考虑 - 介绍一下 Cube 表去重优化 - 介绍一下***识别项目 - 你们商品维表数据量 - 你们实习部门的数仓分层 - 用户域和流量域的区别 - SQL:今天登录但昨天没登录的用户 - 算法:二叉树层序遍历,自己构造输入输出 - 你
#软件开发笔面经# 1、自我介绍 2、面试官:你倾向于数仓还是数开。我:实习做的数仓,所以更倾向于数仓。面试官:好的,我们是做后端开发相关的 3、说一下实习期间做的工作 4、介绍下你的第一个项目 5、了解过zookeeper吗 6、spark中dataframe和dataset的区别 7、简单说一下kafka是干什么的,消息能保证全局有序吗 8、了解容器吗,docker和kubernetes 9、
1.挖项目 2.jvm垃圾回收 3.找问题,String类型循环内使用+= 4.mysql 聚簇索引和非聚簇索引 5.hashmap原理 6.索引数据结构(b+树),特点 7.hive数据倾斜 8.hive mapjoin ,bucket map join ,SMB join 9.flink watermark 10.flink checkpoint. 三种分布式快照算法 11.flink 状态
👥 面试题目 hadoop的三个核心组件,以及hdfs的读写原理 hive的内部表与外部表有什么区别 hive里面的数据倾斜是什么?怎么去处理?该怎么去预防? 数据仓库的分为几层?每一层是做什么的?是根据什么进行分层的? hive里面的窗口函数有没有用过?rank(),,dense_rank(),row_number()这三个有什么区别? hive里面数据表合并是怎么合并的? hive里面的列
春招,面试官很好,大家秋招可以投
1.自我介绍、成绩排名、读研计划、奖学金、是否挂科、有无数模竞赛经历 2.介绍项目,数仓设计中主要考虑的点 3.开发用的语言 4.项目数据量多少,报表用什么软件做的 5.实习工作介绍,dqc怎么用的 6.实习最难的一点是什么 7.机器学习和深度学习了解吗 8.python常用的包 9.rdd和dataframe和dataset的区别 10.hive查询过程怎么优化 11.你的性格在工作中的优势 总
一面 60+min 计网相关的问题,http问的比较细,几乎能问的都问了 常见的加密算法,对RSA、AES、DES等加密方法的原理和攻击方式,国密系列算法 常见的哈希算法的原理,性能,优劣,哈希碰撞等 爬虫项目遇到过哪些密码学对抗,我说了魔改算法等例子 手撕,我说没接触过算法方面,面试官给放了个水:大数相加 介绍爬虫经历:独自讲了二十多分钟,面试官没有打断,涉及到常见验证码厂商的破解过程,js混淆
面了很久,有100分钟,面试官很认真。 介绍项目 MR的shuffle流程 数据倾斜怎么处理,实际处理过数据倾斜吗(我特老实,我说我没有) spark的宽窄依赖,为什么要划分stage 抽象类和接口的区别 hive的四种排序(简历也没写hive,为啥逮着我问) 问了mysql相关 我简历上所有的组件问了个遍,redis spring druid mybatis,可我当时没准备,就没答出来。。。 设
做个记录 基本上问项目,根据简历项目和实习的技术点衍生去问的 写面经攒人品~ 1.自我介绍 2.数据仓库的分层,以及为什么要做数据仓库 3.数据仓库的血缘关系 4.拉链表的实现 5.hive的压缩格式和存储格式 6.星型模型和雪花模型优缺点 7.spark和hadoop的区别 8.spark数据倾斜发生原因及解决方案 9.spark的新特性AQE和DPP 10.kafaka的特性 11.kafak
面试官是个小姐姐,很温柔 自我介绍 了解大数据组件吗 不了解 了解数据仓库吗 不了解 简单讲一下项目 rabbitMQ 在项目中怎么用的 了解kafka吗 不了解 springboot 打包方式 jar包、war包 怎么部署Linux 没部署过 说一下慢sql排查以及优化手段 慢查询日志,explain,索引
本文向大家介绍浅析JVM逃逸的原理及分析,包括了浅析JVM逃逸的原理及分析的使用技巧和注意事项,需要的朋友参考一下 我们都知道Java中的对象默认都是分配到堆上,在调用栈中,只保存了对象的指针。当对象不再使用后,需要依靠GC来遍历引用树并回收内存。如果堆中对象数量太多,回收对象还有整理内存,都会会带来时间上的消耗,GC表示压力很大,然后影响性能。所以,在我们日常开发中,内存,时间都是相当的宝贵,该
本文向大家介绍linux shell数据重定向(输入重定向与输出重定向)详细分析,包括了linux shell数据重定向(输入重定向与输出重定向)详细分析的使用技巧和注意事项,需要的朋友参考一下 在了解重定向之前,我们先来看看linux 的文件描述符。 linux文件描述符:可以理解为linux跟踪打开文件,而分配的一个数字,这个数字有点类似c语言操作文件时候的句柄,通过句柄就可以实现文件的读写操
本文向大家介绍JavaScript处理解析JSON数据过程详解,包括了JavaScript处理解析JSON数据过程详解的使用技巧和注意事项,需要的朋友参考一下 JSON (JavaScript Object Notation)一种简单的数据格式,比xml更轻巧。 JSON 是 JavaScript 原生格式,这意味着在 JavaScript 中处理 JSON 数据不需要任何特殊的 API 或工具包
本文向大家介绍Jquery解析Json格式数据过程代码,包括了Jquery解析Json格式数据过程代码的使用技巧和注意事项,需要的朋友参考一下 今天稍微学习了一下Json,JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。 易于人阅读和编写。同时也易于机器解析和生成。 JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C,