# 一面4.20 电话面,当时忘了记录,一部分忘了 自我介绍 maxwell我没用过,可以简单介绍一下吗 除了maxwell你还知道哪些数据同步工具 介绍项目整体内容,技术方案和业务内容 数据倾斜的解决方案(讲了join,group by的解决办法,但被问还有没有) Linux查看文件命令 more和less的区别 udf、udaf、udtf的区别 hashmap的原理 进程线程区别 你觉得你的性
🕒 岗位/面试时间 大数据研发实习生 👥 面试题目 一面(35min)3.11: 数开实习深挖 巨基础八股 shuffle过程 SQL语言执行顺序等等 做题(5min): 一道算法 一道SQL 反问(5min): 老哥贼热情给我介绍部门以及转正情况啥的 二面(35min)3.12: 数开实习深挖 巨基础八股 hdfs读写流程 数仓分层等等 做题(5min): 一道算法 一道SQL 反问(2mi
1.有了解过JUC吗,讲一下你知道的 2.Java和python的内存管理机制 2.Hadoop,Hive和Hbase之间的关系 3.Spark和Flink有什么区别 4.Flink有哪些组件以及架构是什么样的 5.Flink有哪几种窗口和哪几种时间语义 6.Flink程序的编写流程是什么样的 7.Flink优化了解过吗,讲一下有哪些优化 8.FlinkUI监控页面使用过吗,你主要用来看什么 9.
昨天分享了下八股部分,今天分享下别的part 首先是项目部分,也是从b站的尚硅谷看的电商离线数仓(感觉有点烂大街的项目,面试的时候很多面试官都不咋问)实时数仓由于时间有限就没看,简历里只写了电商离线数仓。大致就是跟着视频听了一遍,具体也没实操。 其次是刷代码题,分两个部分一个是sql,一个是java算法。 sql的话就过了一遍牛客上的sql题,一些基本的case when和开窗函数都是要掌握的。基
本文向大家介绍Android开发学习路线的七大阶段,包括了Android开发学习路线的七大阶段的使用技巧和注意事项,需要的朋友参考一下 看了专业的培训机构的课程大纲,才知道,自己学习android的路途才刚刚开始!特此整理分享一下,希望能帮到那些准备学习android开发,或者正在学习android开发,但是又没有找到明确路线的童鞋们!(PS:特此声明,这篇文章不是给培训机构做广告哈,本人也是在自
主要内容:1.开源OLAP综述,2.开源数仓解决方案1.开源OLAP综述 如今的开源数据引擎多种多样,不同种类的引擎满足了我们不同的需求。现在ROLAP计算存储一体的数据仓库主要有三种,即StarRocks(DorisDB),ClickHouse和Apache Doris。应用最广的数据查询系统主要有Druid,Kylin和HBase。MPP引擎主要有Trino,PrestoDB和Impala。这些引擎在行业内有着广泛的应用。 在云资源层,主要有E
2022/08/13 一面 时长15min 感觉啥也没问 自我介绍 项目主要是大数据相关,你对算法方面了解多少 实习在做什么 想做偏算法还是偏数据的工作 如果其他部门提的取数需求做不了 你会怎么做 面试官介绍他们的电池时序数据 反问:业务部门多少人,入职后做的工作偏算法还是数据 ------------------------------------------- 2022/08/13 面试刚结
一面 30min 两个面试官 一个问技术 一个问综合 自我介绍 比赛经历 比赛中Mapreduce写了哪几部分代码 实习项目说一下 实习任务分工 Kafka生产者消费者说一下 有什么主要的参数 一个SQL题目,要求根据经度纬度输出地点 场景题写一个spark代码 反问 ------------------- 2022/09/22 电话沟通意向 已拒绝 工作地点在宁波 #吉利控股##我的秋招记录#
一面 30min 自我介绍 项目经历 实习项目介绍一下 具体任务调度用的什么 ETL任务血缘怎么设置 实习公司数仓主题怎么划分 你所在部门构成 多少人 阿里云框架各部分负责什么功能 大数据国赛各部分做什么任务 Map Reduce过程介绍一下 count distinct的Map Reduce过程说一下 有几个map和reduce 实现count distinct功能你会怎么考虑优化 一道SQL
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习 1.自我介绍 2.八股文 你写的这个实时数仓,维表是怎么更新的 flink了解吧,flink里面断流怎么处理 flink的exactly-once是怎么实现的 checkpoint的时候barrier什么时候发送 checkpoint产生了很多快照,怎么进行处理呢 sparkstreaming和str
问题描述: 有一张tmp表,字段分别是 开始时间start_date,结束时间end_date,欠费金额amount 输出描述:用户每天需要还的金额 分析:根据题目描述的输入输出,很容易知道思路哈,就是想要把从开始时间到结束时间的每一条数据都拆开存储,然后根据日期去聚合就可以得到每天的欠费金额了,所以难点就在于如何根据一个起始时间来进行拆分呢? 一行转多行,让我们可以想到的就是使用炸裂函数expl
大数据开发暑期实习总结 这篇文章总结了美团近30篇面经的题目,想着大家可能也需要答案,于是我根据自己的理解以及网上的一些答案进行了梳理,如果有不对的地方,大家可以评论区留言讨论哦(别喷我~~~) Java 写一个多线程代码 class RunnableDemo implements Runnable { private String threadName; public Runn
今天早上刚洗漱完,托舍友的福十点才刚准备出寝室门,突然一个电话打进来,说是海信的想给我进行简短的电话面试,我寻思这种面试会问什么问题随即应允。但没想到会把我问成这样...... 开局问我自己本科和研究生都学了些什么,然后不依不饶的追问我研究生学了什么?接着问我在实习期间做的数仓的底层架构和数仓设计,问从后端到前端的数据流程,问存储介质是什么,接着问数据是怎么流转的一连串问题让我难以招架;之后问我在
问了好多好多问题,很多没答好,但是面试官人很好,不会的也引导我, - 自我介绍 **项目** - **身份认证(再仔细看看session和cookie),** - **很多个**cookie,分布式的机器上。怎么办?消息队列? **操作系统** - 进程调度算法 - 时间片轮转算法没有答出!!!面试官还引导qq与微信同时运行,唉 - 虚拟内存与物理内存 - 用虚拟内存为什么快 **计算机网络**
1、计算机网络: (1) TCP的三次握手和挥手 (2)OSI7层模型,每层分别有什么作用 (3)对哪个层的了解比较多一些,平时用得最多是哪一层 (4)传输层的协议有哪些 (5)是否对ip协议有了解,ip协议的分类等 2、数据结构 (1)数据结构的分类 (2)红黑树、平衡二叉树查找的过程、原理 (3)hash,hash冲突,解决hash冲突时单链表长度过长的问题 (4)大小堆 3、算法 (1)堆排