包括快手一二面,字节一面,科大讯飞一面 Hadoop常用文件格式 Inmon 和 Kimball 建模思想有了解吗(我问是范式建模和维度建模吗,面试官说不是) spark有多少个driver和executor,如果给你2核100G(500并行度?好像是这个)有多少executor Sql子查询和外部where执行顺序,你说子查询where先执行为什么不在join on一块执行呢(?是不是我和面试官
1.项目介绍+闲聊18min 2.springboot事务失效场景 3.uuid和自增id区别,分库分表场景下 4.使用过的JUC 5.分布式锁、ID实现原理,项目里的技术选型 6.快照读和当前读,以及mysql下对应的问题 7.手写除单例模式外其他的设计模式 8.求给定的数组中和为0的最长子序列的长度 update8点通知过了,约第二天二面
时间:6.20 时长:10min左右 1. 自我介绍 2. 项目中遇到的困难?如何解决?原创还是开源? 3. 八股:栈的大小;虚拟内存空间;new和malloc的区别;malloc相关的一个问题(忘记是什么了,没回答上);左值引用和右值引用;按层遍历二叉树(队列);top K的问题;TCP如何保证传输可靠;STL容器相关问题 4. 为什么投递这个岗位?对中金所的了解?和专业不匹配怎么看?在上海工作
敦煌网(电商公司面试)(感觉像是kpi面试啊) 居然没要求开摄像头真是奇怪啊。 首先上来自我介绍,然后等我介绍到在滴滴实习的时候打断了我让我展开说说,之后就这段实习经历提问了很多,譬如如何处理数据异常,如何进行A/Btest等;接着是学校经历,问我大数据相关的课程有哪些,有看过阿里的大数据架构之类的书吗?回答没有,过(阿里的书这么受欢迎吗?啊,这就是强者盲从效应吗?)到
1h 面试官感觉是个大佬级别人物,battle了40min毕设,理解了项目的细节 sql20min,求某天每个城市所有来访者的人均浏览内容点击量 1.顺带问了timestamp定义细节 2.timestamp和date为什么需要同时存在 3.优化,本身机制优化 4.优化,谓词下推 5.优化,聚合函数结合律子查询下推 反问前辈对大数据的理解
2023年4月,大数据开发面试笔记V3.0发布,过去已经两个月,V4.0终于来了,这次主要新增了企业级调优手法以及数据湖基础等内容。如今面试越来越难,常常会被问到大数据的前沿知识比如数据湖,以及企业级调优手段有哪些等,于是我结合自己在大厂的工作经历进行了补充,最终汇聚成一份全面的大数据开发面试笔记。 此笔记包含大数据开发、Java、计算机基础、数仓理论、常考SQL、大数据开发场景题
最难蚌的一次面试 百度数据科学实习生,文心一言产品线那边的 有认识的人面过同样的岗位说问的都是业务问题,稍微考了很简单的Python基础函数(处理JSON文件) 结果面试官除了简历没问业务方面的问题,然后问了简历项目上我用过的很多算法问题,很多SQL和Python的函数还有模型,什么窗口函数(并试图提问数据仓库相关),bagging和boost算法的一些关键点和主要区别,怎么预测和进行特征选择,然
1.问本科经历,对大数据的接触 2.问项目是否是真实项目或者实习项目,,不是demo 3.项目介绍,毕设项目讲了15分钟 4.where和having区别(having能单用) 5.Spark宽窄依赖 6.leftrightinnerjoin 7.sql写题,统计所有月销售额超过1w的员工 8.反问,ABtesting--是否是埋点-PVUV-灰度策略的流程
在这炎热的夏天让我心底来个透心凉吧 找实习的时间太晚了所以心中很焦虑,结果就这样华丽丽的葬送了机会啊。面试官还是挺好的,问的问题基本都是数据开发的必考题目,首先是spark的shuffle机制(没答上来,这也是整个面试崩盘的开始)下面是从网络上找到的答案:前一个stage 的 ShuffleMapTask 进行 shuffle write, 把数据存储在 blockManager 上面, 并且把数
形式:电话面 时长:30min,部门mentor直接面试,没有HR面 面经:①自我介绍②详细描述一下实习经历做了哪些,从中学到了什么?③从我描述的实习经历中细问(两个指标之间的区别;如何确定关键影响因子)④数据分析软件掌握情况⑤反问环节 总结:简历内容一定要很熟悉很熟悉,自己做过什么收获了什么一定要清楚描述,基本没问别的拓展问题,一直深挖简历
已Offer 技术面(1h,已过) 1. 自我介绍 2. 问了一下实习,开始挖项目 - 说说你的项目架构,整个流程是什么样的 - 如果让你构建一个大数据分析平台,你会选择哪些组件?(主要是数据存储、计算等) - 如果是要求实时处理呢? 3. 问Flink(不会,直接跳过) 4. 为什么选Clickhouse?和其他OLAP数据库相比有啥特点? 5. 八股 - 进程与线程区别 - 说一下Spring
面试形式:腾讯会议 单面 大概4个面试官 面试时长:10min 题目: 1.自我介绍 2.介绍简历上的一个项目 3.操作系统的启动流程 #面经# #暑期实习#
4.26开放 4.27投 总行科技&大数据岗实习生(开发工程师) 笔试 5.7 易考:摄像头、全屏、编程题 :核心代码模式 不可跳出 无补全 部分题有通过率 行测 1h 单选:语言理解x10、数字运算x10、逻辑推理(文字 图形)x15、思维策略x10、阅读理解x15(1篇文段 2篇图表 每篇5问) 技术题 1.5h 单选x30 多选x10 判断x10(计网、linux、springmvc、jav
一面- 这个岗的风险策略是纯数分 1. python配环境怎么配,你配过吗 2.SQL八股,最迷惑的是问连接表select的关键字,不给我题我咋知道 3.其他都是自我介绍的内容
部门主管来面 1. 开场自我介绍 2. 问了其中做过的一个项目,大约十几分钟 3. 一条Hive SQL具体的执行流程 4. 优化逻辑执行计划具体做了哪些事情 5. 有哪些类型的OperatorTree 6. Map Join和Reduce Join 7. Spark Join的三种方式 8. Hive SQL最后转换成Task提交给计算引擎是先生成MapReduceTask再转换成SparkTa