我是大数据欧老师,曾在互联网某大厂任大数据负责人,从业大数据领域近 10 年,全网粉丝 5000+,从很多候选人的面试和咨询中复盘了大数据工程师的面试全流程,如果你有求职大数据工程师的计划,欢迎找我聊一聊! 直接拿走去复习!!! Hive 知识点(上)- HSQL 语法 什么是窗口函数? ROW_NUMBER() / RANK() / LAG() / LEAD() 的含义? RANK() 和 DE
我是大数据欧老师,曾在互联网某大厂任大数据负责人,从业大数据领域近 10 年,全网粉丝 5000+,从很多候选人的面试和咨询中复盘了大数据工程师的面试全流程,如果你有求职大数据工程师的计划,欢迎找我聊一聊! 直接拿走去复习!!! Spark 知识点(上)- 原理题 RDD 的概念?RDD 的常见算子? Spark 和其他框架的比较?和 Hadoop 的比较?Spark Streaming 和 Fl
一面 50分钟 自我介绍 你学过的大数据掌握的最好的是哪一个 hive里面排序一般怎么使用的 hive内部表和外部表的区别,外部表在什么场景下使用 hive视图用过吗 你对维度和事实的理解 你说到了业务过程,谈谈对它的理解 你刚刚描述的是一个业务过程还是 多个业务过程 多个业务过程放到一张事实表的你举个例子 维度建模中 星型模型和雪花模型 之间的区别 缓慢变化维表如何处理呢 全量表的数据保存多久
一面(约50分钟) 1、自我介绍 2、详细说明工作经历做了什么,有什么成果即工作业绩 3、SQL用的最多的函数有哪些 4、窗口函数rank()、dense_rank()、row_number()的区别 4、两道SQL口述题目 一个表三列分别是:id,顾客的问题,对问题的回答 a)获得顾客问的最多的10个问题 b)获得每个顾客问的最多的10个问题 5、讲述ABtest的过程 6、怎么分析ABtest
字节跳动 国际化短视频用户增长 DA/DS 一二三面面经(已挂 金融难民勇闯互联网,0经历海投的第一份日常面挑战宇宙厂难度,面完感觉已经进入人才黑库 官网投递。title是数据挖掘实习生,但面试下来感觉是数据分析/数据科学。想请问一下大家数分面试的难度是不是都是这样的?统计学原理倒不是问题,但是业务逻辑的考察在三面时被重创。 感谢字节,三场面试累积下来真的学了很多。虽然到三面挂确实很伤心的。 Ti
计算机科学与技术跨专业实习,日常实习四面凉经。 一面,6月8日,1小时40分钟 1. 自我介绍。 2. 实习经历介绍。 3. RFM解释。 4. 归一化是否了解。 5. RFM评分系统设计与分层。 6. Count()和Count(1)和Count(*)区别。 7. 分别解释Left/Right/Inner/Full join,MySQL中是否有Full join(无),如何实现Full join
记录一下第一次面试经历,希望能给到大家一点帮助。 个人情况:中科大本硕 本数学 硕统计 代码能力一般 无任何实习或项目经历 详细见之前的动态。 合订版https://www.nowcoder.com/feed/main/detail/7d5900ae4fb14cb2a20c58f9c9cd5ea6?sourceSSR=users 面试流程: SQL:直接写题目 比较简单 用到的都是比较基础的 jo
一面 1. 抽象类和接口的区别 1)抽象类需要使用extends关键字继承,而接口需要使用implements实现。 2)抽象类的权限可以为public、protected、default,而接口权限必须为public。 3)抽象类既可以做方法申明也可以进行方法实现,而接口只能做方法申明。 可能有坑(面试官可能会问Java8新特性中的接口的默认方法) 4)抽象类中的变量为普通变量,而接口中只能有被
前两面是标签/用户画像方向,二面结束后被推到行业分析/业务分析方向。 一面,6月25日 1. 自我介绍。 2. 挑一段数据分析项目讲讲是怎么做的。(讲了风控实习的时候风险评分项目),面试官评价我基本用的都是统计方法,想到用算法模型吗,我说一个是我不会算法模型,一个是有专门的算法同学负责算法这一块,我作为数分实习生负责制订一些规则。 3. 有没有做看板的经历,挑一个说说思路。答:我做过很多,说了一个
7.27内推 提前批 后端-飞书技术中台 8.22转为正式批 8.28 一面 飞书 1h 实习项目、ai续写的新闻时效性问题怎么解决 设计一个ai聊天机器人、上下文怎么解决(答的不好) mysql索引 mysql里的悲观锁和乐观锁(悲观锁不会 指的是自己加版本号字段) redis应用场景 redis数据结构 zset使用场景 跳表时间复杂度 redis缓存一致性 Mq 如何避免mq重复消费 spr
一面: 1.自我介绍 2.数仓分层 3.来了新的业务怎么建模 4.选用的什么模型,有什么考量 5.如果现在一张事实表一对多一个维度表,此维度表又一对多一个维度表,怎么设计模型 6.实习过程中用的什么计算引擎 7.spark UI会看哪些内容 8.数据倾斜问题怎么解决 9.介绍一下项目 10.为什么有的指标在下沉的时候要拆开来 11.SQL调优,讲一个具体的例子 12.SQL题:求中位数 二面: 1
#软件开发2024笔面经# 2024字节跳动面试 数据岗位 1.模型开发的流程,需求调研过程中有哪些人员参加,调研过程,你会输出什么文档? 2.如何保障数据质量(准确性)? 3.spark有什么优缺点?在使用过程如何规避缺点? 4.spark内存模型? 5.spark和MR为什么会进行shuffle,如何减少shuffle? 6.小文件治理的方式? 7.主题域建设的流程? 8.大表join大表的优
👥面试题目 都说c++是面向对象的语言,面向对象的三个特性能介绍一下吗? 这个问题主要考察应聘者对C++语言中的面向对象编程(Object-Oriented Programming, OOP)原理的理解。具体来说,这个问题涉及以下几个方面: 封装(Encapsulation):保护数据安全,隐藏实现细节。 继承(Inheritance):允许多个类共享通用的行为和属性。 多态(Polymorph
整体评价:字节面试难度确实相对来说还是比较大的,特别是二面,会特别考验下面试者的一些软性能力,例如对于商业化的敏感度和数据意识。 一面: 1. 简单讲下你使用关联规则算法进行捆绑销售的项目,在项目开始之前有预估预期收益么? 2. 接1,整体来看还是采取了AA Test,那么你认为整个实验中有哪些问题会影响AA Test效果? 3. 如何根据达人营销业务来制定指标体系?(假设北极星指标是GMV) 4
7月18号约面试,7月19号下午面试。面试官挺和蔼的,但是我感觉是kpi面试。 面试内容:1、自我介绍。 2、因为简历没有实习经历,面试官询问了一下。 3、问会什么编程软件,Python,Sql,介绍了一下会的库和算法。 4、反问环节面试官介绍了一下工作内容等。 有友友投了一样的岗位可以一起交流呀! #蔚来面试##数据分析#