#数据人的面试交流地##得物# 实习摸鱼没事干,写写之前的面试凉经,顺便复盘一下。😊 bg:双非本中9硕,一段相关实习经历。 timeline:某四字母app投递,6.17上午投递,当天下午过业务筛选约面,第二天上午面试。 面试时长30分钟不到,面试官没开摄像头,有点怀疑kpi面。 提问环节: 1.自我介绍。 2.介绍实习做的一个项目。 讲了做的一个类A/B test项目,追问如何衡量实验的效果
推荐阅读文章列表 大数据开发面经汇总【持续更新...】 我的大数据学习之路 大数据开发面试笔记V6.0 SQL题目 来自今日头条数据研发一面 有一张股票交易价格表ods_stock_trd_log, 包含sto_code(股票代码)、trade_dt(交易日期)以及price(交易价格) 问题:求出每只股票对应的波峰和波谷 波峰:股票价格高于前一天和后一天价格时 波谷:股票价格低于前一天和后一天价
昨天分享了下八股部分,今天分享下别的part 首先是项目部分,也是从b站的尚硅谷看的电商离线数仓(感觉有点烂大街的项目,面试的时候很多面试官都不咋问)实时数仓由于时间有限就没看,简历里只写了电商离线数仓。大致就是跟着视频听了一遍,具体也没实操。 其次是刷代码题,分两个部分一个是sql,一个是java算法。 sql的话就过了一遍牛客上的sql题,一些基本的case when和开窗函数都是要掌握的。基
给了三道题,两道SQL,还有一个程序设计题。 1、银行交易记录表,字段有(id,存取金额(存为+,取为-),交易id) (1)求每个人的总余额 (2)求每次交易后的余额 2、学生成绩表,字段为:学生id、成绩(内容格式为:"数学:xxx,语文:xxx") 将成绩字段拆分为科目和成绩两个字段,每个学生拥有的科目不一定相同 3、一个文件里是一个整数占一个G大小,求该
京东一面 1.项目实习自我介绍 主要讲了自己实习中的实时项目,从开发到上线的整个流程。 2.Flink项目中广播关联要有初始化?怎么初始化的?--自己做的时候没接触没注意到。 3.怎么更新的,key by怎么进行去重的? 4.实时项目 唯独关联是关联mysql中的维度,有可能就是主流数据过来了,但是维度没来,关联不上,这个是怎么进行处理的? 5.mysql维表是数据源,还是检查全表? 是look
从事数据开发,手写面试题5W字,涉及hadoop、zookeeper、kafka、spark、flink、clickhouse等常见的大数据中间件,文档可以后台踢我 1、Hadoop特点 hadoop是一个分布式计算平台,能够允许使用编程模型在集群上对大型数据集进行分布式处理 hadoop的三大组件:HDFS(分布式文件存储平台)、MR(计算引擎)、YARN(资源调度平台) 特点: 高扩容:had
47、zookeeper是什么? 主要服务于分布式系统,可用来做统一配置管理、统一命令服务、分布式锁、集群管理等 48、zookeeper的作用以及适用场景? 数据的发布订阅:由于大数据集群中节点过多,不可逐台进行修改,在设计时候采用统一的配置中心,之后只需要将新的配置发送到配置中心,所有节点都可自动下载更新命名服务:zk通过顺序节点的特性来生成全局唯一IDMaster选举:让所有服务节点去竞争性
数仓开发岗位,但面试以 Java通用八股 为主 1、 Java 数据结构有哪几种,特点 2、Java的基本数据类型和包装泛型 3、Java == 和 equals 的区别 4、Object类的equals和hashcode的特点?什么时候被重写? 5、String、StringBuffer、StringBuilder特点? StringBuiler是怎么实现String可变的 6、封装、继承、多
你之前说你的项目这边涉及大数据这块比较多,那你代码工程是怎么样的一个工程,就是直接用一些have的SQL去搞这种直接数据的开发,还是怎么去做的这种系统的编程。这个工程是怎么搭出来的 对外提供什么接口,系统之间是怎么调接口的传输方式,就是说不同部门之间怎么去调一个服务 Java通常使用什么方式实现http的调用 http里面的get和post有什么区别 从controller到service都用到什
推荐阅读文章列表 大数据开发面经汇总【持续更新...】 我的大数据学习之路 大数据开发面试笔记V6.0 SQL题目 来自字节跳动数据研发二面 有一张用户行为日志表ods_usr_log, 包含user_id(用户id)、start_time(登录时间)以及end_time(注销时间) 问题:求出用户登录的所有最大时间段,比如用户1在10:00登录且11点注销,用户2在10:30登录且12:00注销
Java线程创建的几种方式? 4种 Runnable 和 callable 接口的区别? MySQL事务的隔离级别?事务性的特性?原子性怎么实现的 mysql 索引失效的原因? mysql 索引的数据结构为什么使用B+树? Mysql的执行顺序? Spark的RDD是什么?具体解释下弹性是怎么实现的 数据仓库的概念 Spark的DAG? 三次握手四次挥手的过程 面试体验不太好。。。#软件开发笔面经
部门是做java大数据相关,因为实习做了数据分析相关的工作,所以问了一下这段工作。 八股,Java虚拟机,gc,go的gc,协程 手撕,有序二维数组,查找target, sql,查每个部门的学生,查平均学生选课数量前三的学院 结束问面试官想要招什么类型的学生,说我挺合适的。 ps:我是做go的,感觉自己不太合适😭
tcp三次握手,MySQL底层是什么数据结构,b树b+树区别,数组链表区别,hashmap线程是否安全、底层是什么实现,还问了JVM双亲委派机制和JVM结构。问了项目里面有什么问题,比如高并发是怎么处理
zip函数用于将多个可迭代对象(如列表)的对应元素打包成元组,然后返回一个由这些元组组成的迭代器。如果传入的可迭代对象长度不一致,zip函数会以最短的对象长度为准 setdefault() 是字典提供的一个方法,用于在获取字典中的值时设置默认值,如果字典中包含给定键,则返回该键对应的值;如果字典中不包含给定键,则将该键插入字典,并将其值设为默认值(可选参数),然后返回该默认值 Z-得分规范化并不是
主要问经历,问项目的比较多 hdfs的角色有哪些,功能 hdfs的写流程 Java的线程安全是什么 最熟悉的集合是什么?详细描述一下 Arraylist为什么长度可变 python的装饰器用过没?是什么东西? 手撕python编程题,给定一段字符串,统计出每个单词的频率,频率相同的按降序排序 外部表和内部表的区别? 为什么选择多益? 对游戏的流失人数进行分析? 有没有拿到其他公司的OFFER