原定14.30进场(14.37才进。。。) 1. 自我介绍2min 2. 上一段实习都做了什么 3 4问的两个实习项目用到的算法 5. hive sql 区别 6. hive底层原理知道吗(不知道) 7. Python数据处理用啥包 8. 实习算法实现是调包还是(当然是调包呀😬) 8. 反问 出面试间的时间倒是贼准😅。。。(14.50) 呜呜呜可能是对我不感兴趣?别人问20min为啥俺就13m
1、Spark的作业提交流程? 2、Spark的核心组件有哪些? 3、宽窄依赖的理解,为什么要分宽窄依赖? 4、SparkContext在工作时做了什么事? 5、Spark shuffle有哪些? 6、Hashpartitioner与RangePartitioner的实现 7、对维度建模的理解? 8、雪花模型和星形模型的理解以及优劣对比? 9、线程安全有了解么?介绍下 面试官很友好,是我太菜了,全
自我介绍 问对hadoop各个组件的了解 解释下mapreduce的过程 问有没看过谷歌的GFS论文 问项目里数据库咋建模设计的 对维度建模的了解 对数仓的了解,数仓一般咋分层 GGGG,这之前只关注框架底层了,,没看过数仓的东西#大数据开发面经##实习生[话题]##access#
时长:1h 由于问题太多,分四类进行整理 0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式 1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);
总共33min,凉透了,可能因为我是第一次面试,没经验,被面试官牵着鼻子走 1、数据仓库和数据库的区别 2、数仓的分层 3、维度建模的基本构成 4、了解缓慢变化维吗 5、说一下拉链表 6、用到了哪些用户指标作为算法的输入呢? 7、协同过滤的常用算法有了解吗? 8、Presto和Hive区别 9、Hivesql和sparksql区别 10、Sql:统计最近下单的用户是在去年12月份的用户数量 11、
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验,求个好运 时长一个小时二十分钟 自我介绍 因为学统计的,问了中心极限定理和大数据定律 机器学习-XGBoost算法简介 两道智力题:逻辑判断谁说谎了和分金条 问了为什么研究生跨专业保研了? Hive和MySQL区别 数据库的索引有什么用 说一下索引的类型,还有B+树索引 数据仓库和关系型数据库区别 Hadoop生态圈简介 问我SQL写的
一面 8.29 下午16:00-17:00 1.自我介绍 2.项目介绍 3.项目细节 4.随机森林、决策树、XGBoost的区别和联系 5.离散特征怎么处理?(没听懂面试官想问啥 ) 6.针对项目提问,连续特征怎么处理? 算法:最大子序和 动态规划+贪心算法 做题有点慢 面试官建议:虽然有些东西工作不会用到,但是面试还是会问,题还是应该多刷一刷 不说了,刷题背八股去了,小姐姐很温柔,希望能再给个机
1.自我介绍 2.说一下数据库范式 3.说一下Hbase 4.Hbase的rowkey怎么设计的 5.说一下Clickhouse 6.说一下你了解的数据库底层的一些知识 7.数仓为什么这样分层 8.数据表和数据视图的区别 9.实习 数仓让你觉得有成就感的地方 10.你对离线感兴趣还是对实时感兴趣 11.你知道OLAP数据库都有哪些 12.Sql题 13.Hive Spark优化掌握的怎么样? 14
电话技术面,业务部门直接打电话,看到很少有牛友发这个岗位所以记录一下。 大概十五分钟左右,也可能是我答的不好所以问题比较少。 1.自我介绍 2.hadoop生态 3.hdfs读写 4.spark运行机制 5.hive内外表区别 6.常用编程语言 7.反问 面试官人很好的,我最先开始没接到电话,给我打了好几次,不太清楚的问题也没有过多为难。不过太久不面好多都忘记了,答的并不全面估计凉了。
19分钟,估计是没了 面试官很疲惫 1.自我介绍一下吧 2.你在学生会做过?主要负责什么 3.讲下实习经历把 4.实习数据分析主要分析了什么 5.怎么改变策略让调动校园大使的工作积极性的 (顺便面试官讲解的工作内容) 6.弹性工作时间你可以接受吗 7.租房问题,问了薪资,面试官表示不清楚,我说薪资大概可以租房 8.反问: 面试一共几轮-三轮 对我做一个评价吧 第一次面试大厂,感觉还行,估计是二面难
岗位:数据科学家 面试体验:数分也太卷了,面熟馆年纪看上去不大,亲和力很强。自我感觉答得其实还可以,但是第二天秒挂,还是回来卷算法吧,复活了一个算法工程师岗位,已约面。 字节跳动 9/7 60分钟 1. 自我介绍 2. 经济学中因果推断的相关介绍,算法测如何实现 3. 实习当中遇到的推荐问题的相关解决方案 4. 大科研中模型是如何设计,如何评估的 5. A/B test中,假设检验是什么 6. 第
1 . 自我介绍 2.面试官,你们有教过大数据技术吗?应该没教过吧? 2.spark为什么比MapReduce快 3.spark算子链 4.问项目 5.Sql调优 6数据倾斜 6.一道sql题,思路,之前笔试做过,但只过了2/3 7.有接触过flink实时计算框架吗? 8.MySQL索引是越多越好吗?索引类型?什么时候用聚簇索引,什么时候用非聚簇索引 9.反问。 面试官挺好的,是我太菜了,一些没答
因为来学校宣讲,直接打电话让去面试,笔试也没参加;听完宣讲会后直接面试,因为宣讲会开得比较久,怕太晚结束不了,每次面三个,所有的科技岗都是一个面试官,这个面试官经历挺丰富的,我这组数分和研发的他都能问不少问题; 首先是三个人每个轮着自我介绍,接着就主要问简历,没啥技术问题,我是主要问了我项目,数学建模建的啥,具体是干啥的,遇到了什么问题,收货有什么;然后问为什么选择银行;每个人都是差不多10分钟,
问项目 解释什么是yolo,是什么模型 介绍cnn 池化层有几种 list和元组区别 pass怎么用 怎么处理异常 怎么抛出异常 浅拷贝深拷贝 sql中视图是什么 索引有几类 怎么实现 还有一些记不清了 问的比较基础但杂
面试时间;10.27 1.自我介绍 2.实习中项目遇到的困难,如何解决? 这里我以为问我的是一个我之前参与非大数据的项目(脑抽了),😭。然后说了这个项目的东西了。被暗讽了一波,你咋不投其他岗位要来投我们岗位? 3.问了大数据的八股,多种文件存储格式以及它们的作用,spark调优,乐观锁 4.B树和B+树的区别 PS:(经过第二个问题的时候,心咯噔了一下,后面有些会的东西也回答不好了)😱