40min 面试体验感超好,德子好感+1 Spark sql了解吗?Dateframe 是啥(不会) 项目里数据怎么拉的? Flume+kafka+flume+hdfs 有什么过滤器吗?:3个flume拦截器 判断文件类型+时间戳过滤器+落hdfs小文件检测 数据量:千万 flume拉取时间是多少?(不会,瞎编的10分钟有兄弟了解吗) Spark小文件怎么处理 Kafka 的整体结构:broke+
2023.09.14 数据开发岗 1. python 中 pass 关键字、查看变量类型、string 和 unicode 区别 2. 重载和重写的区别,多态如何实现 3. 线程和进程区别 4. 实习项目按照 STAR 法则叙述一下,难点是啥 5. 第一范式、第二范式、第三范式,范式越高越好吗 6. 两道 sql 题目:city 表选 id 重复出现的数据项,student 表总分按逆序排列 7.
每次面阿里都感觉能学到新知识,不愧是大厂。不过面试官迟到半个小时+不开摄像头就很难受。 第一次面数科岗位,还以为会比较偏机器学习,但是问了好多业务问题,没有准备,基本不会(寄)! 1. 先做30分钟笔试(三道业务,一道回溯手撕):笔试过了还做笔试是没想到的 2. 如何测量红包带来的成交额增长,如何排除其他因素带来的影响 3. 如何做A/B testing 4. 成交额降低分析 #面经#
从今年暑期实习开始直到秋招一共五次面试,转了四个部门,记录一下 实习篇 # IEG一面4.6 自我介绍 项目用的是什么计算方案,技术组件有用到云服务吗 讲一讲你在项目中遇到的问题 项目中计算内存不足调yarn内存,为什么不是spark内存 能讲一讲spark的相关概念吗(讲了基本架构,说任务提交流程太紧张没说完) 面试官提醒讲RDD的容错机制 小表join大表怎么优化的 多小可以叫做小表 数仓当中
秋招篇 # PCG 8.24 一面 秋招并没有投腾讯,是直接被捞起来面的 自我介绍 讲实习内容 讲实习当中做的最好的工作 面试官总结了一下我刚才讲的(好像觉得做的不够难。。) 介绍spark RDD spark程序里面不写action算子,程序会执行吗(肯定的答会。。) 数据倾斜有哪几种 mysql数据库索引有哪些 数据库事务介绍 平常mysql用的多吗 有了解过doris、clickhouse这
科大讯飞数据分析oc 1.围绕数学建模比赛和项目提问 2.sql 基础 3 Python数据处理方法
美的一面(数分岗)综合面试 首先是自我介绍 1、在实习/在校中,遇到的最大的困难的是什么 2、实习过程中,有发现岗位的不足之处是什么 3、实习中,有为公司创造什么收益,好处 4、研究方向。 5、有关注什么社会现象\新闻,校园新闻,有做什么事情吗? 6、在参加社团活动的时候,怎么确保活动的顺利进行? 7、组织活动对个人最大的提升是什么? 8、大学期间对自己的规划是什么? 9、在大学期间/学习期间/组
30min 自我介绍 项目: 介绍一下项目 几层。每层干了什么。去掉一层可以吗(又来) dwd和dws和ads都可以去掉 balabala 数据量 千万级别数据怎么同步? 业务datex+maxwell,行为 直接flume拉。 多久同步一次? 一天一次。 Ads层怎么接到可视化看板? 手拉(这边傻逼了,忘记说接clickhouse同步然后接到可视化软件上了) Zk在kafka里的作用? 保留of
9.13 30min 自我介绍 实验室实习项目 devops流水线项目 遇到什么坑 Springboot自动装配原理 Redis为什么这么快 缓存穿透 jvm内存模型 堆内存分区 垃圾回收 反问 有些问题忘记了,都是基础知识考察
1.让聊一聊你最厉害的项目,挑了一个数据挖掘的讲。 问数据是怎么样的,特征选择是怎么做的,这个东西上线效果怎么样,巴拉巴拉。 2.问了下实习做的事情,巴拉巴拉。 3.看我做过路径规划,问我了不了解 A星算法。 4.平常用什么语言。 5.我们不是互联网公司的,你有投互联网公司吗,你想去互联网公司吗,现在有offer了吗。 6.就业地点想在哪?(怒答西安,捂脸)
20分钟结束 八股:java——hadoop——hive, 再问一问源码有没有看过,如何调试,如何解决异常。
都问些什么呀 会有case题吗 求面筋 更新; 自我介绍 简历深挖 问了一个因果推断/相关分析的问题 之前面试没被问到过呆住 知不知道斯皮尔曼相关系数的优缺点 😅
(被捞起来重新面) 总共40min 手写模板方法,责任链模式(项目中的) spark和mr有什么区别,为什么spark比mr快 磁盘和内存 有有向无环图的这些优化 什么更优秀呢,什么原因导致比mr更快(不知道) spark里面,checkpoint和cache有什么区别,分别用于什么场景(场景完全忘记了) 数仓是怎么分层的 什么是业务过程(不知道) 事实表设计的步奏是什么(不知道) 三范式建模和维
8-3: 自我介绍 实习项目以及实习日常(20min左右) 论文(3分钟左右) 问你对大数据哪个组件比较熟悉 说一下MR的底层原理。。。。。。自己在那不知道从哪里开始说,就从map开始巴拉巴拉到写出数据,自己都讲蒙了。(五六分钟左右) 反转链表,自己处理输入输出以及链表定义(七八分钟),也没给输入输出,就只写了方法体。 先问对hive函数了解咋样,都还行。写SQL:uid,login_time,连
二面就问了20min不到,吓死我了,不过已经发offer啦,分享下二面问的一些题目。 还是挖简历。 数仓建模核心 拉链表、快照表、全量表的区别 好像就这些~