自我介绍 实习介绍主要工作内容 抖音投诉率下降分析 经常使用抖音吗 抖音电商与其他电商比的优势 3道excel题,sql基础(口述即可) 1.表连接 2.个数统计 两个EXCEl回答 情景问题 加班情况态度 自己胜任这个岗位的优缺点 SQl优化性能 是否会python 反问
自我介绍 什么是数据仓库,和数据库有什么区别? 数仓是怎么构建的?(然后开始细抠项目的内容,可怕) Hive的存储格式有哪些? 实习做了什么工作?有哪些难点?为什么离职?(寒冬哪有我的位置?) Spark和Flink的区别是什么?(简单说了一两点,感觉不是面试官要的答案) Spark Streaming接收Kafka数据的两种方式?(这题真不会) 都学过哪些专业课程? 结束 整个流程挺快的,会就是
#数据人的面试交流地# 今年找实习和秋招都很难,很多公司投了都不理,在这里记录一下自己面过的一些公司面经,顺便拿个奖励 2023届实习面经:音泰思(大数据开发实习生) 好像是个对日外包公司,这是我的第一次面试,第一次就体验到了10分钟的面试 下边是面试内容: 2022/03/15 一面: 自我介绍 介绍下项目 jvm垃圾回收机制 为什么要用kafka mr flume断点续传 2022/03/15
#数据人的面试交流地# 第二次实习面试 巨杉数据库 一面 数据库应用开发工程师 2022/03/17 常用的容器,Arraylist hashmap的区别 iolist和listnext(这个可能听错了,当时没听懂是什么) 数组、链表、栈、队列的不同 tcp udp 流量控制 进程和线程 mysql了解啥,说一下高并发 项目 hive sql 用过哪些优化 MVCC用来干嘛 进程间通信的方式 Li
1、自我介绍 2、什么是维度建模?什么是关系建模? 3、星型模型和雪花模型有什么区别? 4、数据仓库分层的意义是什么? 5、对哪些大数据框架比较熟悉?(答了Hadoop和Kafka) 6、Hadoop的进程有哪些?作用分别是什么? 7、Kafka的特点是什么? 8、Kafka为什么可以支持海量数据吞吐? 9、问实习工作内容,以及实习收获 10、能否接受加班? 11、有什么问题要问我的?问了日常工作
#数据人的面试交流地# 十方融海 大数据开发实习生(秋招提前批) 一面:2022/05/30 自我介绍 this super 值和引用 垃圾回收算法 多线程用过吗 回收算法 进程线程 Linux子系统: linux内核的子系统有5个: 1、 进程调度控制系统(SCHED); 2、内存管理系统(MM),主要作用是控制多个进程安全地共享主内存区域; 3、虚拟文件系统(VFS); 4、网络接口(NET)
时间:8.17一面 问题: 1.项目 逐一介绍,不太深挖; 2.SQL ①一道题 在班级中60分以下的随机抽30人,60分以上的随机抽20人,说思路即可 考察SQL中的随机抽取函数order by rand(),这个知识点确实不常见; 这个题目是笔试中的题目,但当时时间原因没写上来,所以面试官又问了一遍,以后面的同学可以把笔试题目做下记录; ②如何优化性能的问题 3.ab实验知识点 ab实验的统计
一面 1、自我介绍 2、先问实习内容,实习涉及了实时数仓,细问了一些点 3、再问项目内容,做的是离线数仓 4、离线数仓的数据源有哪些?是怎么收集这些数据的? 5、离线数仓是怎么分层的?分层依据是什么? 6、JVM的内存模型介绍一下 7、说一下你知道的垃圾回收算法 8、MySQL的存储引擎有哪些? 9、做过哪些HiveSQL优化?或者说你了解哪些优化措施? 10、怎么解决数据倾斜问题? 11、有接触
#数据人的面试交流地# 广州丰石科技 大数据开发实习生 2022/06/07 一面:感觉就是kpi 进去之后做一份面试题,hr叫我做小题,后边的大题不需要做,做完之后面试的时候给面试官看,第一句就是后面的题不会做吗? 蚌埠住了。。。 自我介绍 spark中数据迟到怎么处理 hive权限管理 cdh kafka分区策略 sparkstream对接kafka的方式, hashmap键和值允许为空吗,
时间:8.26 二面问题: 1.项目 深挖,比一面面试官问得更深入,而且感觉二面面试官比较懂运营,所以延伸也是问了相关的发散 2.业务场景题目 滴滴做了一个去西单免单的活动,会有怎么样的效果,如何检验? ①用户增多的趋势;统计分布检验; ②拉动司机 ③(后续面试官补充)会影响西单附近的交通情况,因此要考虑到上报审批等流程环节 3.跑西单司机一定会涨吗,什么因素会影响? 单量+单价金额+平常的拉客活
公司:美图 岗位:数据分析 形式:视频面试 视频面试平台:腾讯会议 面试官:两个数据分析师和 HRBP 时长:60分钟 流程:笔试、面试、反问 笔试 时长:30分钟 形式:飞书文档上作答 题目类型:基础题(SQL:3道问答题、2道代码题)、附加题(对一个业务输出埋点文档) 面试 时长:30分钟 0、面试官自我介绍 1、自我介绍 2、简单介绍一下暑期实习经历,比如参与的项目、负责的部分、用到的技术、
#数据人的面试交流地# 赫基集团 大数据开发实习生 一面:电话面 2022/06/21 1.sql判断是否有重复数据 2.数据库引擎的区别 3.说一下项目 4.项目中转化率数据异常怎么进行清除 二面:主管加hr面 2022/06/31 项目和经历 建模(雪花模型和星型模型) 渐变字段 笛卡尔积用在什么场景?没想出来,最后面试官说这是个坑,说没人愿意遇见笛卡尔积 还有普遍hr问题 反问 科大讯飞 A
时间:9.4 问题: 一位小哥面试官,基本上来一直问业务题,节奏比较快 快手部门的组织架构和上下游对接情况 两段实习的取数需求、看板工作等的比重 实习工作内容有差异,自己的倾向----分析比重更大 sql和python说思路 表中有user_id 和 friend_id,一共包括100人,去计算最小关系网 预测--1000份面试的样本,抽象出特征,去做预测候选人是否通过的模型,怎么搭建? (这个开
公司:一面数据 岗位:数据分析师 形式:视频面试 视频面试平台:飞书 面试官:两个数据分析师 时长:30分钟 流程: 0、面试官自我介绍 1、自我介绍 2、这个实习的岗位更偏向于商业分析,可能更偏向于洞察的产出、可视化的呈现、前端debug等。想问一下你对这一块的看法是什么? 3、过往经历中有哪些是数据分析实际落地到业务上或者有产出实际价值的,可以介绍一下吗? 4、项目经历深挖。数据可视化是基于什
#数据人的面试交流地# 中数通 数据岗 2022/11/02 毕设做好了吗,方向是什么 什么是大数据 用过的存储工具 Hadoop和hive的区别 用过的采集工具采集 数据的过滤是怎么做的,再flume定义的拦截器,json异常怎么进行处理 kafka是什么 用过的数据挖掘,体现再哪里 数据的展示 flume和spark分别是什么,什么时候采用 参加过的比赛 比赛中是如何完成,分工,时间,设计,流