一共两轮技术面一轮HR面,第一轮面试hive 问题居多,第二轮hadoop 问题居多,整体来说问题不是很难,方向为数仓。 一面: 11.30下午 牛客网面试 30min 自我介绍 数仓项目介绍 什么是全量表,什么是增量表,以及应用的场景 了不了解拉链表,讲一下拉链表如何生成 什么是内部表,什么是外部表,有什么区别 Hive中小文件形成的原因及解决办法 Hive SQL的优化方法 讲一下熟悉的窗口函
#互联网公司爆料# 这个公司也是搞物流的吧,估计是做国外的,面试我的第一面是大数据组长,应该是数仓的组长,主要是数仓建模,hive基础,以及spark,以及数据服务以及做的项目的细节,整体面试还可以,终面是技术最高负责人,估计是个副总有40多岁,问了我大数据集群怎么搭建的,服务器是怎么设计的,对于大数据的架构的分布等等吧,感觉是以架构师来问的,薪资好像是15乘14,年终估计拿不满吧,终面还挂了,好
最开始发来的邮件说是电话面,当天走完了一面二面,中间只间隔了二十多分钟,当晚HR面,第二天看状态结束了。。。。凉凉 这次幸亏是电话面,手机直接录音了,记录的详细一些。 一面 面试时间:20min 自我介绍? 实习工作介绍,实习内容,所用的技术栈。。。 怎么和同事配合的?自己有开发了那些?有什么提高? 你们这个项目,你觉得还有那些地方可以做优化? 离线和实时结合,未来发展的一些看法? Hive的组成
1.Spark的运行机制 2.union是宽依赖还是窄依赖 3.常见的action算子 4.reduceByKey和groupByKey的区别 5.Spark的checkpoint 6.Spark的cache和persist区别 7.Flink的checkpoint和Spark的checkpoint区别 8.Flink的两阶段提交问题 反问 用什么做什么 基本大数据组件都会用,shein数据量大而
有些面试因为比较早了,所以只能大概回忆一下,看看能不能帮到大家 不过我有个感觉是:视频面试开摄像头会更好,你能更直观感受到面试官对你的反馈 希望tiktok二面能过!全当攒人品了! 不想在存量市场卷,想去开疆扩土 🔥🔥抖音电商:组长-负责人-交叉-hr 面的最好的岗位,因为面试时面试官就会说 蛮好的我觉得 1.抖音和其他电商的区别 2.你觉得你们业务为什么会死,如果你是公关负责人会怎么处理这次
3.21 一道SQL:按要求查询最近一条修改记录 一道算法题:按要求倒转字符串(可以原地操作) 简历相关:实习+美赛经历(数据相关的经历,问的非常简短,估计前面耗时太长) 大数据生态相关:我阐述了自己现有的理解程度(非常浅薄,自己没有相关项目经验;面试官没有多问) 反问:想从事这方向的工作,还有哪些努力要做? 面试官表示大数据生态方面的知识需要加强,其他计算机基础方面的也可以提高(任重道远呜呜呜)
23.9.21 广立微 共计半小时 在阿里做的项目介绍一下 充电场站项目。。。 用户画像项目详细介绍 java大数据去重的方法 python数据清洗用的什么方法 你们阿里的数据中台中表是以什么格式存储的 模型的评级标准是什么样的 python直接取一行数据 hive窗口函数,一个省一个市,取人口最多的两个城市 hive的行转列和列转行用什么函数 lead和lag是干什么的 mysql不同的关键字的
二面的小姐姐真的好温柔。 1.自我介绍 2.项目以及项目内的工作,我的项目里面我是算法设计+开发,没问框架的问题,主要问了每个模块的输入输出,以及辅助同学做测试时候的具体工作。这段问了很多,感觉主要是想看看分析总结能力? 3.为什么想要做测开,就主要说了我的测试报告能给同学的模型带来提升会满足我的内心云云。 4.测试的分类,答根据不同的基准分类来分。 5.数据库了解吗,一面后我浅浅看了一下,说有一
9.4 19:00 笔试 emm……真的不是给我发错题了吗?为啥我一前端的笔试题是大数据方向啊? 平台:牛客;时间:120min;满分:100分 编程4道:20分+25分+30分+25分 = 100分 看了一下编程题第4题是MySQL??我真的是拿错题了吧??? 编程题1(20分): 唯一ac的题目,题目中说了可以暴力求解hhh,感觉自己只适合暴力 思路大概就是先把数组由小到大排序 然后每个数
了解过优先级队列吗,有哪些特性,是怎么实现的 二叉树和堆的区别是什么,大顶堆和小顶堆是什么 进程和线程有什么区别 讲一下多线程的安全问题,为什么会有这些问题,怎么解决 锁有多少种 进程间通信的方式 管道有多少种(上面答了管道) 僵尸进程是什么 cookie和session session存在哪个地方 http有哪些常见的状态码,502是什么 在浏览器上输入http怎么自动变成https的 tcp和
如 动态 Inventory 所介绍,ansible可以从一个动态的数据源获取到inventory信息,包含云端数据源 怎么写一个自己的数据源? 很简单!我们仅仅需要创建一个在适当参数下,能够返回正确JSON格式数据的脚本或者程序,你可以使用任何语言来实现. 脚本规范 当我们在外部使用``–list``参数调用这个脚本时,这个脚本必须返回一个JSON散列/字典,它包含所管理的所有组.每个组的val
base: bj 岗位: 前端 实际上岗位是发在社招上的, 但我看任职要求里没有要求工作年限, 我就投了 八股文: 自我介绍 介绍 CDN 原理 介绍 https 和 http 的区别 介绍 https 握手过程 https 协议需要基于 http/2.0 吗? 介绍中间人攻击, https 能绝对安全吗? 能够绝对避免中间人攻击吗? 浏览器从输入 url 到显示网页的全过程 上述过程中, 有哪
实习二面 简历算是无项目吧 40min 自我介绍 学校里的研究课题 简历上写的一个比赛,过去太久了都忘了 如果你在刷短视频,上滑的时候卡住了,请你分析原因 哈希表怎么确定某个值的位置 链表和数组增删改查的时间复杂度 算法题:小于n的最大整数(一个数组,里面有一些个位数,可重复使用,由这些个位数组成的小于n的最大整数),我的思路完全不对,看网上说是二分+贪心 测试朋友圈点赞,怎么设计 反问 这么看来
一面: 项目,session和cookie区别,http不同数据请求头区别,http无连接,微服务的通信协议。 测试excel写入1000万条数据思路,文件互相写入测试用例,测试用例设计方法,测试的过程。 做题:sql,算法(倍数关灯)。 二面: 项目,测试论坛发帖思路,mysql事务级别,锁,索引。 做题:文件单词top3,时间复杂度。 三面: 科研项目讲解,测试时如何排错,如何确定是前端还是后
面试官非常重视基础!!! 首先上来问了项目相关,但是过程中自己没有明确描述清楚自己在项目中的分工(面试官最后的评价说的) 其次问的问题大致如下: 因为自己搞深度学习的,面试官先问了python,但是平时用python实在没有什么深入的,和面试官说用C++更多😥 围绕c++的问题: 1. 说一下析构函数 2. 深浅拷贝 3. 怎样理解面向对象 4. 继承是怎么理解的 5. 说一下多态的含义 围绕L