面试时间:60min 我的方向是数据开发,但感觉数开岗位比较卷,加上之前也有一段网络爬虫的实习经历,投了快手的数据采集岗。面试官人还不错,主要问了爬虫项目和我简历上一些大数据的技能,但好像还是方向不太符合,他们更想要会Java开发、app逆向的,最后还一直安慰我。 面试官介绍部门业务和流程 现在还在实习吗?有其他公司在流程吗? 自我介绍 实习介绍?(公司,部门,项目) 开发的Xpath工具介绍?
面试时间:50min 自我介绍 实习内容 工作部门是数据中台,数据中台是什么?和数据仓库有什么区别? 项目用什么采集数据?原理?还了解过其他采集工具吗? 对数仓分层的理解? 你们是按什么标准分主题的?用的什么数仓模型? MR的工作流程? Spark原理?和MR的区别? RDD依赖关系? Job、stage、task划分? Hive介绍,原理?Hsql转换到MR的过程? Hive的文件存储格式? 知
自我介绍 数据倾斜问题 spark的shuffle相对于mr的shuffle有什么区别 spark的stage怎么划分的 yarn中都有什么,作用是什么 hdfs读写流程 rpc和http分别是什么,有什么区别 项目中都有什么数据 数仓的分层,每层都做了什么事 反问 金风科技二面总经理面 自我介绍 总经理问题: 1.本科和研究生都是通信,为什么选择大数据 2.怎么在完成学业同时学习大数据的 2.对
哈哈哈感觉也没啥面经, 自我介绍,相关经历,数据产品工具考察 投了两次金融岗都被挂了简历,随手投了一个数据产品就进面了,然后面试的时候面试官就告诉我你不适合这个岗位 so,我应该被HR刷KPI了 你为啥不用金融岗刷我个KPI呢,也能攒点经验😭😭
感觉自己和快手的相性不是很好,每次都和面试官不和,感觉应该是无缘快手 1.自我介绍,大数据组件是自学的吗 2.工作内容,定位,成果介绍 3.前期调研也是你做的吗,怎么调研出的指标体系,耗时多久 4.复购率是几日复购率,为什么选择这个天数不选择15天,你这个调研不够深刻,调研他的打法和业务目标不才是第一步要做的事吗 5.有多少个维度和指标,为什么用grouping sets不用cube,介绍coun
1.自我介绍 2.实习介绍 3.实习工作内容下游使用方主要有那些? 4.AI团队数据支持 他们使用这个数据做的什么 5.除了对表的支持之外,是否在计算层面做过一些优化 6.boradcast join和sortmergeJoin的区别和 使用场景的不同 然后面试官开始说,我觉得概念你应该都会,我就不问你了,所以我后面会从场景的角度去考验你的技术理解,本人听到这里心凉了半截,因为两段实习全是离线,这
1.自我介绍 2.MySQL的事务隔离级别,慢SQL排查 3.Redis持久化AOF RDB 、集群、哨兵 4.HashMap 5.线程池
1.十分钟自我介绍 2.项目最难点和最有技术的点 3.一句话总结你的问题解决方案 4.一句话总结你的项目的价值 5.手撕:合并k个有序链表 6.问机试题目思路 大部分时间在写算法,感觉面试官对大数据相关的技术栈不太感兴趣,问大数据相关问题就像走过场一样,最后也没有反问,emmmm有点难评 #数据人的面试交流地#
自我介绍 为什么这么快找实习 离线数仓介绍 数据哪里来的 有什么数据 实时数仓和离线数仓的数据是用的同一份数据吗 有什么需要去聚合的指标 做这个项目有什么收获,难点 sql题 第二大薪水 排序秒了 8.19 oc
👥 面试题目 1. 字符串串池复用判断题 String str1 = "abc"; String str2 = new String"abc"; String str3 = "abc"; 2. try catch finally的作用;finally一定会执行吗? 3. Exception &error的区别 unchecked
场景题:上游订单数据有问题,时间也是错误的,你怎么从 ODS 中找到这张订单表的位置?(不会) 第一种思路:全表扫描 第二种思路:做一张表,对表id进行hash,表中存储该表id对应的分区 DWS 层能不能没有(答:模型设计中我们一般要做到公共处理逻辑的下沉和单一,所以一般我们会把汇总逻辑放到DWS层,不把它暴露到APP层去实现,所以一般总会设计DWS层的) FlinkCDC MySQL 连接器的
如图所示,一些基础的八股。然后秒了3道算法题。
2022.10.10 一面 1h TDL优化推动存在什么问题? 所有的下游修改代码由公共层实现是合理的吗?如果不合理有什么解决方法? 目前整个数仓多少任务?(母鸡 目前数仓分几层?你觉得目前分层中的平衡应该怎么做到或者有什么思考? SQL题:一个tb表,里面有姓名,课程分数,课程名称,目标:取最高课程分数的学生名字。我的答案用了join,然后提问:join的优化有哪些? Java题:反转字符串,用
面试官晚进5分钟,但是态度很好,一共就面20分钟,聊天为主,无手撕无sql 进来先说一面以聊天为主,不会难为校招生,不要紧张 自我介绍 在校学什么课 tcp三次握手 建表建库等语句随便说几个 实习有做哪些开发 实习http异步请求的异常情况 如何了解到我们公司 测试流程(没答好,只介绍到了回归测试) 白盒和黑盒的区别 实习有做白盒嘛(没有) 什么情况下会code review 反问: 完整测试流程
时间:2022 年 8 月 31 日。 base: 深圳 时长:40 min 左右。 自我介绍都免了,全程做题,感觉是被 KPI 了。 一共三道题(一个 CSS,一个算法题,一个 JS 处理数据的题)。 CSS 三列布局,中间自适应,左右两边不随中间滚动。 flex 布局,左右使用 ,此时已脱离文档流,因此要通过 分别指定侧边栏的位置,通过 避免 center 覆盖左右侧边栏。 JS (1)二叉树