时长:1h 由于问题太多,分四类进行整理 0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式 1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验,求个好运 时长一个小时二十分钟 自我介绍 因为学统计的,问了中心极限定理和大数据定律 机器学习-XGBoost算法简介 两道智力题:逻辑判断谁说谎了和分金条 问了为什么研究生跨专业保研了? Hive和MySQL区别 数据库的索引有什么用 说一下索引的类型,还有B+树索引 数据仓库和关系型数据库区别 Hadoop生态圈简介 问我SQL写的
#校招##秋招#
自我介绍后根据我的项目问我了一些问题,虚拟列表,懒加载,canvas怎么压缩的(这个没答对) 项目怎么实现鉴权的,我说的jwt,巴拉巴拉 然后又问了cookie, 问了防抖节流 项目跨域是怎么解决的(项目上线后用反向代理不太好) 问了数据类型,然后就问深拷贝浅拷贝,让我实现深拷贝 问promise,让我实现all和race方法 解释下事件循环机制 nextTick 总结:还是要多写写底层源码,回答
一面 面试官会一步一步引导, 也会给出自己的见解,体验很好 简单介绍一下自己 接口优化,讲讲背景,怎么做的 八张表同时并发去查的话,会不会对数据库的压力很大,有没有考虑这方面?数据库的负载怎么样? 什么情况会导致索引失效?索引命中的原理? select .... where b = xx and c = xx 会命中索引吗,怎么优化这个问题? 有个字段叫city,你觉得用city建索引合适吗 用单
1.问项目 2.数据倾斜,spark,hive,问的比较多。大多是简单的八股 3.问java很多(没复习,哭死) ①java的多态是怎么实现的、 ②java泛型了解吗 ③java反射了解吗 ④java垃圾清理机制是什么 ⑤java多线程了解吗 直接一问三不知 4.sql现场写代码
1.自我介绍 2.你对redis宕机后的方法 我:...... 3.你说到算法。你有刷过letcode算法? 我:很少刷letcode,一般都是刷sql的 3.kafka的副本同步 我:忘了 4.谈谈你对数仓的理解 我:..... 5.谈谈你对hbase和clickhouse的理解 我:.... 6.你说你对hive中的ads层数据导入到MySQL,为什么不是直接从hive的ads层中访问 我:不
个人情况简述:本硕双非,acm银牌 随便找群友要了个内推投递 笔试4.2题,投递选择的是都喜欢,笔试完在人才池待了十几天,被数仓部门捞了 一面(总时长50分钟) 聊实习经历和简历项目,聊了约30分钟 聊天环节把整个技术栈聊的差不多了,还有离线、实时数仓的很多点,后面又问了几个问题 离线数仓分层设计、实时数仓设计,spark、flink相关生成经验,S3、OSS的使用理解,k8s的使用心得等都在聊项
公司:蚂蚁集团 部门:CTO线-数据产品与技术部 岗位:数据研发工程师 形式:电话面试 时长:22分钟 流程: 1、自我介绍。 2、介绍一下实习的工作。 3、这个项目中有几个人? 4、在项目中遇到了什么困难? 5、实习的公司有没有类似数据中台的部门? 6、在数据预处理方面做了哪些事情?怎么保障数据的规范性和准确性? 7、介绍一下建模的工作。 8、学校里有没有学过数据挖掘相关的课程? 9、对于分类和
公司:蚂蚁集团 部门:信贷事业群-风险管理部 岗位:数据研发工程师 形式:电话面试 时长:31分钟 流程: 1、自我介绍。 2、对数据开发岗有了解吗? 3、实习的时候接触到的数据来自哪里? 4、你是怎么理解数据仓库这个岗位的? 5、你刚才提到了数据沉淀,那你觉得有哪些方法来做数据沉淀? 6、如果让你做数据ETL的话你有兴趣吗? 7、对大数据的技术栈哪些比较熟悉? 8、传统的数据仓库和关系型数据库有
一面技术面-30min: 自我介绍 锁竞争优化 条件变量 项目介绍/相关问题 右值引用 vector有没有右值引用优化 push_back接口 kmp gdb 实习问题 反问 二面技术面-30min: 自我介绍 项目介绍/项目问题-效率和内存优化 智能指针 写个排序算法 项目问题 反问 三面hr面-25min: 对岗位的了解 职业规划 实习时长/目的 实习地点/岗位 所做项目的目的和来源 到岗时间
滴滴 前端研发实习 一面 一对情侣面的我,超级和蔼还和我开玩笑,不过他说他们主用react不用vue 问了点vue和css的知识 手撕题出了个括号匹配,秒了 然后叫我自我介绍 又问了点vue 总共20几分钟,过于容易像kpi面#不给转正的实习,你还去吗# #面试等了一周没回复,还有戏吗# #我的简历长这样#
本人社招,面试大数据研发工程师岗位,一共三轮面试。 1、一面(技术面),约40分钟,面试题如下: (0)自我介绍,别照着简历说,补充说些简历上没有的,比如哪里人、兴趣爱好、优势有哪些等。 (1)笔试,编程题,语言自选,题目:输入一个字符串,找出其中的整数,按升序排序后输出,多个相连的数字为一个整数,排序可用类库自带方法。 实现很简单,这里就不提供答案了。 (2)笔试,SQL编程,
研究生学的机器学习,结果今年算法岗全军覆没,倒是开发岗被捞了。由于是三个多月之前的面试,有些问题记不清了,特此抱歉。 23.11.30 一面 自我介绍 JVM的组成,垃圾回收机制 MapReduce的流程,Spark与Hadoop的优劣 快速排序的原理,是否是稳定的(估计是前面答得不太熟,太久都忘了) BEV的原理和流程(简历项目) 笔试第一题的思路 手撕(只记得是一道滑动窗口的题,用两层for就
腾讯会议一面(30分钟) 自我介绍 项目介绍 数据如何采集,整个流程叙述一遍 项目难点说一下 两个项目的区别讲一下 数仓分层里面的表叙述一下有什么 分析一下两个事物之间的关系,怎么分析(有点抽象的问题),有什么经验