2022-8-9 下午两点十八 HR面 1 自我介绍 2 实验室研究方向 3 成绩排名 4 比赛 6 7 8 9.... 2-3周会通知结果 offer得等研究院开放 #大华提前批##面经#
一面 实习介绍 设计过哪些数据指标,这些指标的意义 项目介绍 具体分层怎么做的 表怎么设计的 对数仓和数据湖的理解 连续登录3天的用户 问的太少了,估计没想招我 #面经##大疆#
联通数科-数据开发 三四个面试官挨个提问 1.自我介绍 2.针对简历问了项目和实习 3.一个简单的sql题 口述 表中有id不重复和邮箱重复 找出重复邮箱… 愣了一下 因为题目说的很简短没有其他要求 然后就回答 对邮箱groupby count一下 面试官说没问题 4.询问使用过的数据库 (不大记得原话是啥,细问了一下是说olap存储引擎吗? 面试官说是 像ck、hbase、doris)回答:使用
主要内容:1.开源OLAP综述,2.开源数仓解决方案1.开源OLAP综述 如今的开源数据引擎多种多样,不同种类的引擎满足了我们不同的需求。现在ROLAP计算存储一体的数据仓库主要有三种,即StarRocks(DorisDB),ClickHouse和Apache Doris。应用最广的数据查询系统主要有Druid,Kylin和HBase。MPP引擎主要有Trino,PrestoDB和Impala。这些引擎在行业内有着广泛的应用。 在云资源层,主要有E
2022/08/13 一面 时长15min 感觉啥也没问 自我介绍 项目主要是大数据相关,你对算法方面了解多少 实习在做什么 想做偏算法还是偏数据的工作 如果其他部门提的取数需求做不了 你会怎么做 面试官介绍他们的电池时序数据 反问:业务部门多少人,入职后做的工作偏算法还是数据 ------------------------------------------- 2022/08/13 面试刚结
一面 30min 两个面试官 一个问技术 一个问综合 自我介绍 比赛经历 比赛中Mapreduce写了哪几部分代码 实习项目说一下 实习任务分工 Kafka生产者消费者说一下 有什么主要的参数 一个SQL题目,要求根据经度纬度输出地点 场景题写一个spark代码 反问 ------------------- 2022/09/22 电话沟通意向 已拒绝 工作地点在宁波 #吉利控股##我的秋招记录#
一面 30min 自我介绍 项目经历 实习项目介绍一下 具体任务调度用的什么 ETL任务血缘怎么设置 实习公司数仓主题怎么划分 你所在部门构成 多少人 阿里云框架各部分负责什么功能 大数据国赛各部分做什么任务 Map Reduce过程介绍一下 count distinct的Map Reduce过程说一下 有几个map和reduce 实现count distinct功能你会怎么考虑优化 一道SQL
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习 1.自我介绍 2.八股文 你写的这个实时数仓,维表是怎么更新的 flink了解吧,flink里面断流怎么处理 flink的exactly-once是怎么实现的 checkpoint的时候barrier什么时候发送 checkpoint产生了很多快照,怎么进行处理呢 sparkstreaming和str
问题描述: 有一张tmp表,字段分别是 开始时间start_date,结束时间end_date,欠费金额amount 输出描述:用户每天需要还的金额 分析:根据题目描述的输入输出,很容易知道思路哈,就是想要把从开始时间到结束时间的每一条数据都拆开存储,然后根据日期去聚合就可以得到每天的欠费金额了,所以难点就在于如何根据一个起始时间来进行拆分呢? 一行转多行,让我们可以想到的就是使用炸裂函数expl
大数据开发暑期实习总结 这篇文章总结了美团近30篇面经的题目,想着大家可能也需要答案,于是我根据自己的理解以及网上的一些答案进行了梳理,如果有不对的地方,大家可以评论区留言讨论哦(别喷我~~~) Java 写一个多线程代码 class RunnableDemo implements Runnable { private String threadName; public Runn
今天早上刚洗漱完,托舍友的福十点才刚准备出寝室门,突然一个电话打进来,说是海信的想给我进行简短的电话面试,我寻思这种面试会问什么问题随即应允。但没想到会把我问成这样...... 开局问我自己本科和研究生都学了些什么,然后不依不饶的追问我研究生学了什么?接着问我在实习期间做的数仓的底层架构和数仓设计,问从后端到前端的数据流程,问存储介质是什么,接着问数据是怎么流转的一连串问题让我难以招架;之后问我在
问了好多好多问题,很多没答好,但是面试官人很好,不会的也引导我, - 自我介绍 **项目** - **身份认证(再仔细看看session和cookie),** - **很多个**cookie,分布式的机器上。怎么办?消息队列? **操作系统** - 进程调度算法 - 时间片轮转算法没有答出!!!面试官还引导qq与微信同时运行,唉 - 虚拟内存与物理内存 - 用虚拟内存为什么快 **计算机网络**
1、计算机网络: (1) TCP的三次握手和挥手 (2)OSI7层模型,每层分别有什么作用 (3)对哪个层的了解比较多一些,平时用得最多是哪一层 (4)传输层的协议有哪些 (5)是否对ip协议有了解,ip协议的分类等 2、数据结构 (1)数据结构的分类 (2)红黑树、平衡二叉树查找的过程、原理 (3)hash,hash冲突,解决hash冲突时单链表长度过长的问题 (4)大小堆 3、算法 (1)堆排
1、 项目一直挖 2、 Spark调优 3、 Shuffle之类的优化 4、 平常写SQL注重优化之类的问题 5、 第一道题让看下面Java代码写输出。 private static void test(int[] arr) { for (int i = 0; i < arr.length; i++) { try { if (arr[i] % 2
1. 自我介绍 2. 要不要读博 3. 上一段实习经历中最困难的是啥/最不舒服的是啥/怎么解决得困难 4. 有女朋友吗?在哪里 5. 家在哪里?未来想在哪里工作?父母什么看法。 6. 投阿里没有,为什么不去阿里(感觉答得稀烂|我说投了被拒了) 7. 目前在进行中的应聘有哪几家,会选择去哪家 8. 啥时候能来实习?实习到啥时候 反问: 包住宿吗? 多久出结果?我有啥可以提高的