1.自我介绍 2.学校大数据有哪些课程,做了哪些实践 3.你觉得大数据是什么,对于社会的帮助 4.大数据和大模型的联系,你在实习或者写sql的时候有没有用过大模型 5.你觉得大模型可以取代你做的这些数据开发工作吗,把大模型甩给业务人员,他们可以用大模型完成数据开发吗 6.针对大模型和大数据,总结一下,从短期来看和长期来看 7.对于spark3.0的新特性了解吗 8.spark的join有几种,和M
很快就18分钟吧 1.自我介绍 2.说说你对C++了解多少,讲讲智能指针 3.说一说C++17 C++20 4.说说你了解的数据结构 5.说一说你了解的Linux,你为什么用这个Linux,对他了解多少,有什么好处 6.内存泄漏怎么处理的,定义是什么 7.讲一讲你对动态规划的理解 8.反问: 感觉G了,岗位不是很匹配 #你都收到了哪些公司的感谢信?##杉岩数据#
1.十分钟自我介绍 2.项目最难点和最有技术的点 3.一句话总结你的问题解决方案 4.一句话总结你的项目的价值 5.手撕:合并k个有序链表 6.问机试题目思路 大部分时间在写算法,感觉面试官对大数据相关的技术栈不太感兴趣,问大数据相关问题就像走过场一样,最后也没有反问,emmmm有点难评 #数据人的面试交流地#
自我介绍 为什么这么快找实习 离线数仓介绍 数据哪里来的 有什么数据 实时数仓和离线数仓的数据是用的同一份数据吗 有什么需要去聚合的指标 做这个项目有什么收获,难点 sql题 第二大薪水 排序秒了 8.19 oc
一面: 面试时间:2024.07.03,共计80分钟 全程项目经历,在工作中做的事情。 按着简历上写的"工作内容",一条一条的问。 问题 自我介绍 后面打算是在上海 or 北京 or 其他地方? 之前工作离职了吗? 介绍之前工作中参与的项目? - 自己承担了哪些工作? - 在承担的工作中,哪些是挑战 or 难点 or 亮点的工作、怎么解决的? 数据开发工作流程? - 一个需求流程走完,大概需要多久
4/22 一面 4/26 二面 5/ 1 offer emm,昨天加hr微信,没加我,但今天51居然发了offer,可能他工作日忘记发offer了吧..
自我介绍:是怎样的人,有怎样优势,做怎样改进 岗位是否匹配预期 介绍工作内容 业务方沟通需求 整理数据,提出数据,可视化 提供给业务方 能力:沟通,数据分层实践 数仓了解多少 机器学习拷打 SQL考察 思维题 什么是数据分析 面试官简述数据分析理解 反问
1.自我介绍 2.jvm的gc全流程,为什么要分这么多区,标记整理等算法对于gc的优缺点,遇到过哪些gc的实际例子,怎么定位这样的问题 3.同一个进程中有三个线程,一个线程发生了内存溢出,另外两个会怎么样,为什么 4.线程共享数据怎么实现的,一致性怎么保证 5.手撕:判断完全二叉树,反转链表 6.sql:窗口函数 7.hdfs架构,读写数据流程,datanode在写数据的时候挂了怎么办 8.小文件
场景题:上游订单数据有问题,时间也是错误的,你怎么从 ODS 中找到这张订单表的位置?(不会) 第一种思路:全表扫描 第二种思路:做一张表,对表id进行hash,表中存储该表id对应的分区 DWS 层能不能没有(答:模型设计中我们一般要做到公共处理逻辑的下沉和单一,所以一般我们会把汇总逻辑放到DWS层,不把它暴露到APP层去实现,所以一般总会设计DWS层的) FlinkCDC MySQL 连接器的
#软件开发2024笔面经# 阿里云数据开发岗位面试公司名称:阿里云 面试岗位:大数据开发 整个是大数据开发,我以为是数仓开发,结果问的全是Spark问题,被搞自闭了。1,自我介绍 2,park中RDD的Task数量由什么决定?3,Spark怎么实现算子中的变量共享?4,Spark共享变量的使用条件? 5,可序列化?连接池实例是在算子内还是在算子外? 我一开始没想好,先回答了连接池的作业:是为了连接
一个小姐姐打电话告诉我会议号的。 进去之后,先自我介绍,然后让我讲项目。 hdfs的读写机制 雪花模型星型模型的区别和适用场景 小文件的弊端 又在问项目 20分钟结束了,反问环节都没有。。。
首先肯定是惯例,先自我介绍。 Golang 因为是大数据岗位,所以面试官本身也不是那么精通go,所以问的比较水。 谈谈指针是啥,出现的意义? init函数和main函数的区别和联系 用过struct中的tag吗?谈谈这是啥? 计算机网络 tcp协议在哪一层?http呢? 数据结构 谈谈线性表是什么? 那么数组和链表的区别呢? 你上面说了时间复杂度这个概念,那么什么是时间复杂度?o(1)和o(n)的
#面经##面经#1. hdfs的shell命令,说实话没想到会问这个(平时用都是直接网上查api),让我说如何查看文件前五行,如何复制文件,详细到把命令行+参数都说一遍 2. mapreduce流程 3. mapreduce和spark区别 4. 讲一下spark的rdd 5. 讲一下hdfs架构,2ndNameNode工作机制 6. java基本类型和引用类型的区别,==和equals()的区别
以为是做大数据分析早上起来看了半天项目,结果面试问得是机器学习和数据建模竞赛 1 自我介绍 2 介绍一下数学建模比赛(太早了我都忘了) 3 介绍用了什么算法 优化还是分类balabala 4 用什么语言写的 你在项目中的工作是什么 5 看你的描述你好像比较擅长机器学习 然后就给我看代码 让我说他这个是干啥的 没太看懂 说的很混乱 后面面试官都不想听了 然后就挂了估计 #数据人的面试交流地# #如何
1.自我介绍问项目细节。说亮点,没啥问的。 2.考察map、shuffle、reduce执行过程 3.考察sql 语句逻辑上执行过程,出个题引导。 4.问string常量池三个场景,串相加判断是否相等 5.最后只留10分钟给我做算法题,蛇形矩阵。。 就问了数据库Java几个概念。啥八股文也没问,项目随便问了下。KPI面吧。最后问了下只有4个hc。。。。。