TimeLine:一面20220826,二面20220902,三面20220915,HR面20220920,意向20221017 BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师 写在前面的话:字节秋招走的是跨部门转正,并非官网投递。以下问题并未完全记录当时的回答内容,敬请读者谅解 一面 1. 如果用户的人均使用时长下降,怎么分析? ①明确分析指标: 人均使用时长 = 总使
1、实习的工作是什么? 2、SQL调优有哪些? 3、介绍一下项目,主要做什么工作?(项目介绍还不顺畅) 4、为什么学大数据? 5、项目里的Flume是怎么用的? 6、TailDir为什么可以断点重传?(面试官说不能) 7、Linux什么指令可以监听文件? 8、Flume的事务是怎样的?(因为上一题提到了事务) 9、Kafka的基本架构? 10、RXR队列(不知道是什么东西) 11、Kafka的pa
1、实习的工作内容是什么? 2、有写过UDF吗?如何实现UDF? 3、UDF要成为永久函数怎么做?如果不加temperory,函数下次还能用吗? 4、UDTF了解吗? 5、Hive的窗口函数有了解过吗? 6、开窗函数Over()中有没有orderby有什么区别? 7、汇总数据开发是怎么做的?(实习工作) 8、Flink任务的并行度和内存怎么设置的? 9、Flink的TaskManager内存模型了
TimeLine:一面20220901,二面20220901,HR面20221009(已挂) BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师 一面 1. 商分和数分的差别? 2. 如何向刚开始接触AB实验的同事解读实验结果? 3. 如果某指标受到组前和策略的共同影响,如何确定策略对该指标的影响大小? 4. AB实验中如何对异常指标作归因? 二面 1. 商分的缩写是BA,你
一面:电话面试 1、自我介绍 2、挑一个实习项目讲一讲 3、项目里的数据是怎么处理的? 4、数据研发选择哪一块?(数据仓库、数据平台、数据算法、数据挖掘) 5、讲讲MapReduce的原理 6、环形缓冲区为什么要反向? 7、实习的存储计算用的是什么组件 8、有金融相关知识的储备吗? 反问: 1、这一面算是第一面吗(是)?算专业面吗(是)? 2、做什么工作的?(国外金融银行业务) 3、用到哪些技术栈
#数据人的面试交流地# TimeLine:一面20220722,二面20220727,三面20220810,HR面20220815,意向20220824 BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师 一面 1. 简述p值的概念 定义1:根据检验统计量的样本观察值得出的概率,此概率为原假设可被拒绝的最小显著性水平 本质上是一种概率,可以由统计量的样本观察值计算出来,与显著
面试岗位:数据库工程师 两个面试官,一个主要问知识点,另一个主要问实习、项目 介绍一下HDFS的写流程 Spark、Flink有哪些部署模式? Standlone和Yarn(Client、Cluster),会话模式、单作业模式、应用模式 有没有写过Flink平台的开发代码? Yarn由哪些角色组成?各自的任务是什么? Yarn的调度器有哪些? Hive和HBase的区别是什么? 项目中Kafka的
TimeLine:一面20221014,二面20221027,三面20221111,oc20221125 BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师 一面 群面,9-10名面试者被随机分成两个小组,玩类似地产大亨的游戏(通过拍卖形式购买建筑地块,建筑地块组合),最后5分钟结果阐述,1分钟补充发言,更详细的游戏流程读者可自行搜寻相关文章进行阅读 二面 1. 请介绍一下实
线下群面: 五分钟读题,然后每人简单自我介绍+说出对题目的答案,然后讨论20分钟,最后5分钟派一个人总结。 题目:(2选1) 1、如何构建数据中台? 2、设计一个智能家居,应该有哪些功能?用什么技术实现这些功能? 测评: 性格测试+图形推理+资料分析 二面: 1、自我介绍 2、详细介绍一下项目 3、实习的数据框架和项目的数据框架有什么区别吗? 4、数据采集还了解其他工具或架构吗? 5、数据加工处理
笔试:选择题+填空题+判断题+简答题 简答题 1、说说大数据技术的特点 2、说一下Spark任务执行的流程 3、1G的文件,每一行是一个词,词大小不超过16字节,内存1M,找出频数最高的100个词。 技术面 1、自我介绍 2、本专业主要学什么? 3、介绍一下实习的项目 4、小文件问题怎么处理?(SequenceFile、CombineInputFormat、JVM重用) 5、Hive支持哪些存储格
分享前吐槽:面试不开摄像头,面试官的语气跟快断气了一样…… 1、有了解web开发、后端开发吗?(无) 2、线程和进程有哪些区别? 3、怎么看一个正在执行的JAVA程序的线程状态? 4、新生代和老年代主要是干什么的?比例是多少? 5、HDFS的服务组成有哪些?它们分别的作用是什么? 6、除了Hive之外,还用过其他数仓吗? 7、Flink的窗口主要是干什么的? 8、Flink的dataStream和
TimeLine:一面20221108,二面20221124 BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师 一面 群面,10名候选人,5分钟阅读题目,每人1分钟时间陈述个人看法,10分钟时间团队讨论,5分钟时间汇报,之后会对一部分面试者进行单独提问 二面 5分钟时间,体验很一般,面试官会在面试者回答问题时打断发言,且面试官问的问题与岗位本身无太大关联 1. 1分钟时间自
9.26投递——12.13面试 面试时间:6分钟 面试官:2人 自我介绍 论文专利情况 有没有法律、财务方面的学习(???我不懂) 介绍一下毕业设计 高考分数、生源地 在校期间获奖情况 是否参加学生会 是否接受地点、岗位调剂
自我介绍 深挖实习 了解哪些数据库?我选了mysql 然后问了我一道简单的sql问题 why杭州银行 还投了哪些企业?银行? 反问:需要做柜台吗?不需要 感觉这个岗位还是偏数据库一点 我的经历只有数分其实有点不对口,也没有什么数据库知识 面试官人特别好,一直鼓励我别紧张,也和我说数分其实不接地气,更偏业务一点。我表示我真的很想走技术😭 虽然感觉没戏但还是特别感谢面试官😭体验感蛮好的
1.自我介绍 2.为什么从图像算法(科研方向)转到大数据(偏业务)方向 3.对flume和kafka的理解,两者什么区别 4.对hdfs,hive,spark的理解,它们的关系是什么 5.superset是干吗用的 6.怎么考虑到来深圳的