1.自我介绍,城市相关 2.你对于大数据哪一块比较了解,展开讲讲 3.结合项目讲数仓建模理论 4.数仓分层的理解和好处,每一层的作用 5.app层如果下面有多个看板,他们有多个指标是重复的,你怎么设计app层才能保证数据查询起来容易又包装数据的一致性呢 6.指标体系的了解 7.原子指标派生指标衍生指标 8.日活留存率怎么算,要得到连续十五天相对于第一天的的留存率,如何优化 9.spark学到什么程
今天面了字节大数据开发的三面,记录一下: 面试官先自我介绍,然后开始问专业知识。 1.你了解实时领域和离线领域的哪些技术? 2.mapreduce和spark作为计算引擎的差异 3.spark的rdd是什么 4.如何理解rdd中弹性的概念 5.spark有哪些调优方法 6.spark中的join操作有哪些 7.数仓建模方法有哪些 7.介绍一下flink的双流join,以及双流join可能会遇到哪些
2024/9/12 16:40 40min - 自我介绍 - 我看你本科不是计算机的,你学过一些专业课程吗? - 你是投的大数据开发吗?还是调过来的? - 开源项目介绍 - 剩下三个项目介绍 - 你的项目Redis是单机的还是集群 - Redis 槽了解过吗 - 对Spring Boot有了解吗? - Redis中基本数据结构 - 如果一个Hash存的对象非常大,会导致什么后果? - 接口可以继承
1.自我介绍 3min 2.介绍一个你最熟悉的项目 10min 问:这个项目你做了什么(被说工作内容简单,没有太大贡献) 遇到的难点是什么(被说这个难点不难) 怎么解决的 整个表的数据量大概是多少 3.你在美团用到了哪些技术栈 4.讲一下kafka怎么保证不丢数据(答了三种acks,面试官说这是生产者端的,那其他的呢,直接说忘了然后道歉) 5.kafka的offset存在哪个地方的 6.kafka
给了三道题,两道SQL,还有一个程序设计题。 1、银行交易记录表,字段有(id,存取金额(存为+,取为-),交易id) (1)求每个人的总余额 (2)求每次交易后的余额 2、学生成绩表,字段为:学生id、成绩(内容格式为:"数学:xxx,语文:xxx") 将成绩字段拆分为科目和成绩两个字段,每个学生拥有的科目不一定相同 3、一个文件里是一个整数占一个G大小,求该
了解大数据吗? 分布式是什么? 1、list、set、map之间的区别与联系 2、arraylist和linkedlist之间的区别与联系 3、数组与链表的区别 4、线程和进程的区别?为什么要设置线程? 5、线程安全如何保证?几种方法?为什么会出现线程不安全 6、线程池用于干啥? 7、同步与异步的概念? SQL相关 1、讲一下索引?索引怎么实现 2、列排序是什么数据结构? 3、B树和B+树的区别?
本人社招,面试大数据研发工程师岗位,一共三轮面试。 1、一面(技术面),约40分钟,面试题如下: (0)自我介绍,别照着简历说,补充说些简历上没有的,比如哪里人、兴趣爱好、优势有哪些等。 (1)笔试,编程题,语言自选,题目:输入一个字符串,找出其中的整数,按升序排序后输出,多个相连的数字为一个整数,排序可用类库自带方法。 实现很简单,这里就不提供答案了。 (2)笔试,SQL编程,
8.26 50min左右 首先自我介绍,然后问了许多项目的问题 然后问了mr的原理和运行流程 hive如何确定reduce的数量 Spark和mr的区别 数仓分层 数仓维度建模问题 什么是维度表和事实表 数据库的三范式 做题 首先是一个sql题,很简单,但是我只刷了大量的java题不会sql的呜呜呜以后一定多刷 然后写了一个归并排序 面试官人超好,特别有耐心 上天保佑让我一面过吧! #快手面试
一面:80min 1、自我介绍 2、介绍部门情况 3、介绍下部门的数仓建设情况 4、简述实习里的三个实习做的项目,聊背后的逻辑 聊了好久好久 5、聊聊在字节认为部门最厉害的技术是什么 6、聊聊自己的爱好 7、觉得自己有什么有优点 8、团队协作和个人工作区别是什么,各自的优点和缺点 9、一道sql题,有两个数组,展开数据,角标相对应的取出数据 10、sql的job和stage划分,窗口函数是否会sh
一面: 无自我介绍环节,直接开问 1、聊实习项目,很细,聊了好久 2、yarn任务提交流程 3、spark的stage切分原理 4、spark任务提交流程 5、对比mr和spark,为什么都用spark 6、谈谈对hudi的理解 7、kafka的负载均衡原理 8、两道算法题,字符串相关的 9、反问 ps.好多过程不记得了 二面: 三个模块 开发 大数据 算法 不想回忆了,直接自闭,一点都不会 但是
到店业务 有点久远一直忘了写,就记得这么多 一面: 1、自我介绍 2、比赛中遇到的难点 3、实习中做的项目,聊项目细节 (大部分时间都在问这个) 我好像很多面经都这么简略的写,这次写细点儿哈,里面涉及到的一些知识点,具体项目就不聊了 数仓模型设计方法 数据质量如何判断 如何保障下游查出时间 对于重要程度不同的任务如何合理分配资源 dwd层建模方法,考虑哪些东西 spark任务调参逻辑和常用参数 c
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习 注意这是日常实习!!! 1.自我介绍 2.刷题 冒泡排序 3.八股文 3.1 JVM JVM的内存结构 类的加载过程 静态代码块和代码块初始化的顺序,以及静态代码块在哪个阶段被加载【初始化】 垃圾回收器 一个方法报错了,怎么进行分析,比如A方法调用B方法,B方法调用C方法....【没太懂】 3.2 并
首先是自我介绍,这里我1分钟就结束了。接下来是问实习的部分: 1、如果发现路由网中出现了问题,怎么快速找到对应的出问题的点。 2、具体展开一下如何解决的这个问题。 3、TCP、和UDP的区别,以及应用场景。 项目:讲的是webserver 1、如何体现高性能 2、什么情况可以采用多线程 3、io多路复用的过程 4、epoll的原理 4、服务器的性能如何测试(qps) 另外的八股: 1、如何理解my
#久邦数码面经#久邦数码 -- iOS开发工程师 -- 一面 1. 请自我介绍一下 2. 请说一些你知道的数据结构 3. 说一下数组和链表吧, 他们有什么区别 4. 请讲一下快速排序 5. 讲一下单例模式 6. 在什么情况下会使用单例模式 7. 说一下进程和线程的区别吧 8. 进程间之间有哪些通信方式 9. 讲一下死锁 10. 网络中有哪几层 11. 说一下http和https的区别 12. 说一
数据开发-电梯数据开发举例 离线数据开发 实时数据开发 数据开发-电梯数据开发举例 更新时间:2018-02-01 21:17:58 假设电梯设备,每天都会定时上传数据,每台电梯每隔1分钟会上传一次数据,包括电梯id,运行状态(上行,下行,停止),门状态(打开,关闭),数据会进入离线表和实时的METAQ。 离线数据开发 业务需求:电梯利用率情况(某个单位的电梯在某个小时段内利用率,可以减少这个单位