8.26 50min左右 首先自我介绍,然后问了许多项目的问题 然后问了mr的原理和运行流程 hive如何确定reduce的数量 Spark和mr的区别 数仓分层 数仓维度建模问题 什么是维度表和事实表 数据库的三范式 做题 首先是一个sql题,很简单,但是我只刷了大量的java题不会sql的呜呜呜以后一定多刷 然后写了一个归并排序 面试官人超好,特别有耐心 上天保佑让我一面过吧! #快手面试
上来先做了一道 最近登录日期 的sql题 然后开始问大数据八股,,,, 1. mapreduce map端的shuffle过程 2. spark stage 划分的依据 3. 宽依赖和窄依赖 4. 了解kafka吗 5. spark sql与mysql sql的区别 6. spark dataframe 和dataset的区别 7. 数据库中id设计 除了uuid和时间戳,还有什么方式 #招银网络
阿里巴巴-智能信息事业群-数据研发工程师 一面(11.21) 涉及项目、机器学习算法、sql、Python 等等,大概40min。 自我介绍 项目深挖 调参经验 catboost和xgb的区别 数据挖掘项目中你为什么不采用深度学习? 说一下深度学习效果不好的原因? 打比赛有什么收获 python2 和 python3的区别 如何对字典按照key排序? 多模态算法有哪些?MMOE和PLE的区别及原理
一面(技术面) 自我介绍 hadoop架构 namenode的功能,对namenode影响最大的计算机资源 介绍一下hive 宽依赖,窄依赖 写过复杂sql吗,介绍一下 sql分组过滤 java的hashmap c++和java的区别 介绍一下hbase 数据库三范式 二面(hr面) 自我介绍 为什么选择中移互联网 了解中移互联网吗(这里尬住了,压根不了解) #中移互联网##数据研发#
一面:80min 1、自我介绍 2、介绍部门情况 3、介绍下部门的数仓建设情况 4、简述实习里的三个实习做的项目,聊背后的逻辑 聊了好久好久 5、聊聊在字节认为部门最厉害的技术是什么 6、聊聊自己的爱好 7、觉得自己有什么有优点 8、团队协作和个人工作区别是什么,各自的优点和缺点 9、一道sql题,有两个数组,展开数据,角标相对应的取出数据 10、sql的job和stage划分,窗口函数是否会sh
一面: 无自我介绍环节,直接开问 1、聊实习项目,很细,聊了好久 2、yarn任务提交流程 3、spark的stage切分原理 4、spark任务提交流程 5、对比mr和spark,为什么都用spark 6、谈谈对hudi的理解 7、kafka的负载均衡原理 8、两道算法题,字符串相关的 9、反问 ps.好多过程不记得了 二面: 三个模块 开发 大数据 算法 不想回忆了,直接自闭,一点都不会 但是
一面: 上来八股轰炸,而且巨难,一直让我思考。支支吾吾答上来了一些 写sql:没写出来,说了个思路 面了50分钟最后让我反问,我说:"感谢面试官让我学到了很多,我觉得我回答的不好,就不浪费您时间了,就这样吧" 出来2分钟hr打电话给我约第二天二面,我:??? 二面: 面试官上来就说我看了你的一面,觉得你答的还算正常,但也就是一般般,我更看重来了之后可以直接上手做项目,下面我们开始写sql吧 给了两
阿里云数据开发一面,问项目穿插八股,本帖就只记录一下八股部分 1.三范式是什么 2.Spark RDD和DataFrame的区别 3.Spark涉及shuffle的具体算子 4.MySQL存储引擎是什么 5.MySQL存储的结构是什么,为什么不能用特别长的key 6.使用过哪些大数据框架 7SQL的窗口函数,什么作用,具体例子 8.了解过云计算吗 9.springboot会用吗
这是阿里巴巴的一个研发岗位,涵盖一些大数据的笔试 专业面试问题 #软件开发2024笔面经# 针对过往经历 Q:字节确实注重数据驱动,这样子的决策方式可能会有什么问题?哪些决策没办法用这些方法进行验证? Q:结合过往实习经历,你现在想要帮商家提升GMV,你觉得该如何去进行提升? 行为面 Q:在这几段实习经历中,哪段需要联系各方的人推动解决问题的情景更多? Q:在合作过程中遇到比较多的卡点是什么,导致
到店业务 有点久远一直忘了写,就记得这么多 一面: 1、自我介绍 2、比赛中遇到的难点 3、实习中做的项目,聊项目细节 (大部分时间都在问这个) 我好像很多面经都这么简略的写,这次写细点儿哈,里面涉及到的一些知识点,具体项目就不聊了 数仓模型设计方法 数据质量如何判断 如何保障下游查出时间 对于重要程度不同的任务如何合理分配资源 dwd层建模方法,考虑哪些东西 spark任务调参逻辑和常用参数 c
#牛客解忧铺##牛客在线求职答疑中心##你觉得今年春招回暖了吗##面经##大数据开发# 附加信息:211本+985硕(非计算机),笔试4出头的分数,面了90分钟,面试官人超好,奈何本人过菜 1、部门介绍 2、自我介绍 3、项目介绍,在项目中承担什么角色,如何完成工作 大数据相关: 4、对大数据开发的理解 5、知道什么常用的大数据开发组件 6、谈谈MapReduce的原理 7、谈谈shuffle的实
大约45min 自我介绍 项目介绍 编程题: 顺时针打印矩阵(实际上变成了按顺序打印矩阵) 一个数的二进制有几个0 SQL: 每个学生合格了的成绩的平均分(HAVING) 总成绩第三名的学生 SHELL: 数一个文件出现了几个"beijing" 智力题: 3l和5l的杯子,量出4l水 操作系统: 死锁是什么、怎么解决 计网: 浏览器访问一个网站,有哪些过程 数据结构: 了解哪些数据结构 hashm
1. 面试官很好,因为他刚下班,所以双方开头相互介绍自己,后面问我有实习过吗,我就如实回答了在广州亚信这边实习过,还问我离职原因什么的,我又不能直接说在公司学不到什么,后面就乱编理由说是因为自己没戴口罩上班感冒了(其实是真的感冒了然后真的感觉学不到什么所以想辞职),面试官就说难道你来深圳身体就好了吗,后面我就说因为家里原因,面试官就不再追问了 2. 开始拷打八股,感觉他问的我之前好像都没怎么看过,
自我介绍(尽量与职位相关) 数据仓库的分层结构 如何为新业务建模 选择模型的依据和考量 设计一个一对多关系的事实表和维度表 实习中使用的计算引擎 Spark UI的关键内容 数据倾斜问题的解决方法 项目介绍 指标下沉时为何要拆分 SQL调优的具体案例 SQL题:求中位数
发帖求好运 部门:基础研发平台-数据科学与平台部 --------- 一面:57min 1.自我介绍; 2.讲最熟悉的项目; 3.爬虫遇到的问题,如何处理的呢; 4.mysql:left join \ right join \ full join,用一个案例讲一下; 5.数据仓库了解吗; 6.Hashmap的原理了解吗; 7.Hadoop了解吗; 8.NameNode了解吗; 9.HDFS为什么安