大约45min 自我介绍 项目介绍 编程题: 顺时针打印矩阵(实际上变成了按顺序打印矩阵) 一个数的二进制有几个0 SQL: 每个学生合格了的成绩的平均分(HAVING) 总成绩第三名的学生 SHELL: 数一个文件出现了几个"beijing" 智力题: 3l和5l的杯子,量出4l水 操作系统: 死锁是什么、怎么解决 计网: 浏览器访问一个网站,有哪些过程 数据结构: 了解哪些数据结构 hashm
1. 面试官很好,因为他刚下班,所以双方开头相互介绍自己,后面问我有实习过吗,我就如实回答了在广州亚信这边实习过,还问我离职原因什么的,我又不能直接说在公司学不到什么,后面就乱编理由说是因为自己没戴口罩上班感冒了(其实是真的感冒了然后真的感觉学不到什么所以想辞职),面试官就说难道你来深圳身体就好了吗,后面我就说因为家里原因,面试官就不再追问了 2. 开始拷打八股,感觉他问的我之前好像都没怎么看过,
自我介绍(尽量与职位相关) 数据仓库的分层结构 如何为新业务建模 选择模型的依据和考量 设计一个一对多关系的事实表和维度表 实习中使用的计算引擎 Spark UI的关键内容 数据倾斜问题的解决方法 项目介绍 指标下沉时为何要拆分 SQL调优的具体案例 SQL题:求中位数
发帖求好运 部门:基础研发平台-数据科学与平台部 --------- 一面:57min 1.自我介绍; 2.讲最熟悉的项目; 3.爬虫遇到的问题,如何处理的呢; 4.mysql:left join \ right join \ full join,用一个案例讲一下; 5.数据仓库了解吗; 6.Hashmap的原理了解吗; 7.Hadoop了解吗; 8.NameNode了解吗; 9.HDFS为什么安
拷打实时数仓(建模,为什么要分层,为什么选择HBase作为数据库,所有数据都要旁路缓存吗,旁路缓存HBase数据经常变更,Flink工作流程) 怎么处理数据倾斜 数仓常用的维度建模方案有哪些 建模模型有哪几个,分别适用于什么场景 Hadoop生态圈、MapReduce工作流程、 为什么大数据用Kafka多、Kafka工作流程、Kafka怎么保证数据有序、Kafka同一个主题下分区之间是否有序 SQ
#2025实习##数据开发工程师实习##数据开发##面经##万声音乐# 万声音乐集团 1面: 1. 自我介绍? 2. 数据库和数据仓库区别? 3. 两个建模有什么区别? 4. flume拦截器如何实现? 5. 事实表概念? 6. 事务性事实表的局限性? 7. 拉链表是干什么的,为了解决什么问题? 8. 构建一个指标的流程? 9. sql:活跃用户,七天活跃用户?
1.自我介绍 2.对公司有没有了解 3.inner join的底层实现,有哪些算法 4.两个数组,数组的大小都在数千万级以上,但是值域是在一千万以内,找到两个数组相同的元素(说了bitmap) 换了部门负责人来面试 5.有了解过数仓整体的架构吗(面试官说现在是存算分离,实时和离线一体) 6.有写过UDF吗,当时的场景是什么样的 7.假设现在用的是yarn,pyspark从提交文件到让代码分布到各个
官网投递完成测评后一周收到了一面通知,没有笔试,准备了半天的八股最后完全没有用到,有两个面试官,一个面试官介绍了一下自己的部门,问了一些技术不相关的问题,一个面试官问了一下项目,也没有多问,整体下来不到三十分钟。当天收到了 hr 面试邮件,感觉好像 kpi 啊啊啊啊啊😰😰😰 补一个后续7.9 周日正在床上摸鱼,收到了录用函,本菜鸟也终于有offer啦! 感谢东子,我爱东子!!!
蔚来一面 数据开发 24届 日常实习 base武汉 看了jd,感觉岗位更偏向数仓方面的,面试过程中疯狂拷打框架底层原理 我本人不是很match 1. 自我介绍 2. 问了我简历上的项目,在项目中遇到的问题 3. 然后项目集群环境,在搭建节点服务器过程中遇到的问题 4. 高可用集群这些 怎么实现 出错了怎么办 怎么排错 5. 造成高可用集群脑裂的原因是什么 6. Hadoop 如果配置的zkfc无法
问的都是数据结构的问题 1.给一个整数,怎么把它翻转(123转成321) 我说用字符串他说不行 2.忘了 3.有两个整数型数组,里面的整数范围都是1-1000w,问怎么找出两个数组中相同的数字 已挂
1 介绍下你自己 我按照常规的套路,先自我介绍,然后介绍我的项目,想引导着问些八股,但是好像没用😂 2 32位和64位你能联想到什么,从机组操作系统,数据结构等角度,开放性的谈一下你的理解😂😂 这个问题直接问了15分钟 3 手撕代码 给你一个应用场景,设计合适的数据结构,并完成两个功能函数 看出来是树了😂😂,但是没咋刷算法,以为只问sql,我的格局小了,写了二十分钟,一点不会😂😂 总
有幸收到阿里大文娱的实习一面,面试官是个很温柔的姐姐,下面记录一下问题: 1.自我介绍 2.说一下你的两个项目,挑一个讲(我挑了Flink相关的一个项目讲) 3.checkpoint怎么做的 4.exactly-once的语义是怎么实现的 5.你了解反压吗? 6.在校课程会学什么 7.你是怎么理解数据科学的?(科学的去获取、存储、处理、分析、挖掘数据) 8.你提到数据分析,你可以讲讲数据分析的思路
一面 聊项目 2道sql lead/lag函数 like pandas基础 数据倾斜问题 二面 聊项目 表连接方式 数仓各层作用 数仓建模类型有哪些 维度模型有哪几种 sql执行计划 mr过程 数学建模怎么分工 为什么不读研 数据中台产品了解哪些 已oc #面经#
是脉脉这个公司的面试,不是脉脉上投的公司的面试。 虽然没想去,但我感觉也没资格去 面试官一直在说不做评价,不做评价,懂我意思吧。 问了java、jvm、scala偏函数 大数据问了kafka选举流程;yarn调度器;zk。哪不熟问哪,反其道而行。 偏底层组件开发,我可能偏数仓吧,技术力还没到这个程度。问的有点怀疑人生 面试官结束直接告诉我今天到这了,我说问问题呢问问题,他说理论上实习生没有提问环节
1. 维度建模和范式建模是什么,两者之间比较大的区别。 2. 为什么说维度建模可以故意引入数据冗余,而范式建模要避免数据冗余,它们这样做的目的是什么? 3. 两道Sql题。 order_info ( order_id bigint, -- 订单id city_name string, -- 城市名 driver_id bigint, -- 司机id passenger_id bigint, --