首先做了三道SQL题,主要涉及分组聚合、窗口函数。 3.3 一面 28min: 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min: 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran
时长:1h 由于问题太多,分四类进行整理 0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式 1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);
总共33min,凉透了,可能因为我是第一次面试,没经验,被面试官牵着鼻子走 1、数据仓库和数据库的区别 2、数仓的分层 3、维度建模的基本构成 4、了解缓慢变化维吗 5、说一下拉链表 6、用到了哪些用户指标作为算法的输入呢? 7、协同过滤的常用算法有了解吗? 8、Presto和Hive区别 9、Hivesql和sparksql区别 10、Sql:统计最近下单的用户是在去年12月份的用户数量 11、
- 3/9笔试 - 选择题大概三四十个 - 问答题10个,涉及python,HSFS八股,Java八股 - 3/14一面,全是快问快答25min - 问简历,项目介绍,项目中提到的模型被揪出来问了细节 - 常见的机器学习算法讲讲,深度学习会多少呢? - 编程语言?希望会Java - 各种排序算法,时间复杂度,随便介绍几个呗 - Python的装饰器 - 指针和引用的区别(这是C++,但是当时并不知
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验,求个好运 时长一个小时二十分钟 自我介绍 因为学统计的,问了中心极限定理和大数据定律 机器学习-XGBoost算法简介 两道智力题:逻辑判断谁说谎了和分金条 问了为什么研究生跨专业保研了? Hive和MySQL区别 数据库的索引有什么用 说一下索引的类型,还有B+树索引 数据仓库和关系型数据库区别 Hadoop生态圈简介 问我SQL写的
工业设计本科应届生,有鹅厂+绿厂的实习经验 —————— 【面试内容】 1、自我介绍 2、说一一下你在腾讯和oppo实习之间的区别 3、为什么选择大疆 4、对大疆了解多少 5、除了网络信息的了解之外有用过产品吗 6、说一下你作品集中你比较满意的一个项目 7、深究项目: 组内成员构成、怎么产出、产出逻辑、 最终成果、碰到什么问题怎么解决、 怎么对接上下游、怎么安排时间、 工作流程什么样的… 8、再介
自我介绍 介绍项目 shell命令怎么调试 shell怎么获得上一条命令执行结果 shell命令怎么在后台执行 说说Linux多线程编程 说说Linux网络编程过程 手撕代码:反转链表 ps:寄了,太多东西不记得了 #我的实习日记#
#我的实习求职记录# 4.26 四道笔试: (1)写一个toast组件 (2)复杂嵌套对象根据id访问相应值 (3)数组去重的方法 (4)promise.all 1、position有那些值 2、除了settimeout还有那些定时器 3、settimeout怎么模拟setInterval 4、复杂对象嵌套你的写法,问题是什么 5、数组去重 set和filter有什么区别吗 6、promise.a
一面就是业务面,更多的侧重于作品集的内容,更关注面试的人在这个项目中承担的职责和反思的能力。虽然是做B端业务但是也深挖了我C端的项目,沟通时候也非常有亲和力。 二面是业务负责人,问到的问题会更多侧重于之前实习中承担的工作和对上下游合作方式的理解,相对视角会更高。也会问关于行业选择和你自己的对工作的需求和规划。 三面是HR面,我本来以为到此就结束了。HR小姐姐非常专业,会针对以往的工作经历、籍贯、职
一面就是业务面 更多的侧重于作品集的内容,更关注面试的人在这个项目中承担的职责和反思的能力。虽然是做B端业务但是也深挖了我C端的项目,沟通时候也非常有亲和力。 二面是业务负责人 问到的问题会更多侧重于之前实习中承担的工作和对上下游合作方式的理解,相对视角会更高。也会问关于行业选择和你自己的对工作的需求和规划。 三面是HR面 HR小姐姐非常专业,会针对以往的工作经历、籍贯、职业规划提出一些问题,考察
二面已经是交叉面了,面试官问的问题也都是跟部门业务比较相关的,会比较关心对于数据的抽象能力和归纳总结能力。大哥人很好很nice,后面讲解了很久他们部门的业务和对于实习生的一些期待 1. 简单自我介绍 2. 在科研和实习中是不是有一些可以通过数据分析解决问题的case分享 a. 介绍了xx实习期间的xx项目(toB) i. 追问如何熟悉了解工作中涉及到的系统的,有没有什么有趣的发现,或者通过数据找到
1.自我介绍 2.说一下数据库范式 3.说一下Hbase 4.Hbase的rowkey怎么设计的 5.说一下Clickhouse 6.说一下你了解的数据库底层的一些知识 7.数仓为什么这样分层 8.数据表和数据视图的区别 9.实习 数仓让你觉得有成就感的地方 10.你对离线感兴趣还是对实时感兴趣 11.你知道OLAP数据库都有哪些 12.Sql题 13.Hive Spark优化掌握的怎么样? 14
电话技术面,业务部门直接打电话,看到很少有牛友发这个岗位所以记录一下。 大概十五分钟左右,也可能是我答的不好所以问题比较少。 1.自我介绍 2.hadoop生态 3.hdfs读写 4.spark运行机制 5.hive内外表区别 6.常用编程语言 7.反问 面试官人很好的,我最先开始没接到电话,给我打了好几次,不太清楚的问题也没有过多为难。不过太久不面好多都忘记了,答的并不全面估计凉了。
投的阿里其他三个志愿都简历挂,这次是被捞的。面了快1个小时,无手撕,6点面完8点就挂了 自我介绍 介绍webserver,有哪些功能,有哪些对标的项目 为什么要使用Reactor模式, 为什么不直接用多线程 线程池怎么解决存在CPU占用长的任务导致其他任务饥饿的问题(答了动态建立线程和线程根据任务分类,面试官不满意) 网搜答案:不同的任务使用不同的线程池,线程池中的任务应是同类的、独立的 主流电商
总体面试思路 : 看简历问(无套路) —— 自我介绍 + 问项目 + 问简历内容 (偏网络 操作系统 写成绩就一定要准备好) 【项目】 Redis 缓存热点数据 , 你如何判断是热点数据呢 ? 使用的数据结构是什么,如何考虑的呢 , 平时都使用过什么数据结构呢 ? 为什么 Redis 快 ? Redis + Lua 实现防止订单重复提交,如何实现 ? 这种方式可能出现什么问题吗 ? 给一个可能出现