字节跳动 (1h) 1.自我面试 2.挑一个你认为比较成功的项目进行介绍? 3.介绍你做过的特征工程 4.你都有过哪些算法?介绍下随机森林、XGB、GBDT的差异 5.对模型进行评估时候选取的方法 携程控股(45min) 1.自我介绍 2.选择一个项目进行介绍 3.你建模的时候都用到哪些方法 4.项目细节 5.模型评估 腾讯科技(1个小时) 1.自我介绍 2.直接问项目 3.解释下随机森林和GBD
一面 60+min 计网相关的问题,http问的比较细,几乎能问的都问了 常见的加密算法,对RSA、AES、DES等加密方法的原理和攻击方式,国密系列算法 常见的哈希算法的原理,性能,优劣,哈希碰撞等 爬虫项目遇到过哪些密码学对抗,我说了魔改算法等例子 手撕,我说没接触过算法方面,面试官给放了个水:大数相加 介绍爬虫经历:独自讲了二十多分钟,面试官没有打断,涉及到常见验证码厂商的破解过程,js混淆
笔试:10月22号笔试,提前刷刷行测也是有必要的,英语有两篇短文,还有一些英语单选,计算机专业知识考的很少。 一面:11月10号,面试时间比较短,数据中心偏运维,当时问我如何看待DevOps,用过什么自动化运维工具,还有就是论文相关内容,还有简历以及八股相关。大概五分钟。 二面:11月30号,领导面试+人力面试,大概15分钟 有一些简历问题,不太难,只要简历上写的能说上来就可以。 开放性问题: 问
# 一面 9.18 自我介绍 实习工作用的什么计算架构、开发节点怎么调度的、数据量多大、每天跑多久 介绍spark shuffle 阿里用的olap数据库是什么 阿里的onedata建模规范 了解clickhouse吗 可以接受来实习吗 你对自己的规划是什么 (到这里只有十几分钟,问我有什么想问的) 开始反问 # 二面 9.19 自我介绍 介绍Hadoop 介绍spark任务执行流程 Spark几
总时长30分钟左右 1.自我介绍 2.大数据学习过什么技术? 3.数据工作有哪些岗位? 4.写一个二分法 5.一道sql,从表中提取出所有课程分数大于90的学生id 6.最近在学什么新技术? 7.进程和线程的区别?哪个开销比较小? 8.tcp和udp区别 9.职业规划 10.反问 总结:最近看测试内容比较多,对于大数据了解不多。面试官态度挺好,还要补的东西有点多我,sql都没写出来。找工作找得失去
一面: 自我介绍 专业主修大数据什么方面 hadoop有什么组件 数仓分层有那几层各自有什么作用 等等常见的问题 手撕sql编程,见过,应该是利扣的,想了半天差点没想出来,中等难度? 面试官人很好,不紧不慢不会催你 我慌的一比 一共三面,等待后续更新 #面经#
一面:投的数研,实际数科 1.自我介绍 2.实习内容 3.实习团队架构 4.map reduce原理 5.数据倾斜有没有遇到过?怎么解决 6.ab实验原理、流程、如何分析 7.假设检验原理 8.口述sql题目:求连续登陆三天的用户 9.假设检验概率论场景题:求置信区间 10.常用的机器学习算法 11.随机森林原理 12.求职意向,数科还是数研,安排下一轮面试官(回数研后第二天结束流程) 13.反问
一面 常见数据结构 维度建模 事实表建模 工作中维度建模是怎么处理 三种事实表的区别 mapreduce原理 hdfs读写流程 增大资源是否会有限制 是否遇到过数据倾斜 二面 数据倾斜 数据治理怎么做的 职业规划 爱好 三面 主题域 数仓建模 bucket join
一面 1.自我介绍? 2.为什么从数分做数开? 3.你觉得数分和数开有什么区别? 4.spark和hadoop哪段实习接触的? 5.讲一下mr和hive原理? 6.hdfs中,一个block大小和通常配置个数? 7.用spark还是用hive?spark比hive好在哪里? 8.spark既然是基于内存的,那么内存不够怎么办? 9.数据倾斜? 10.uid粒度和did粒度用在AB不同的场景是指什么
1,CAP的概念,raft属于哪一种? 2,读写分离的东西懂不懂?比如说主从复制中读请求跟写请求的关系?回答了主从复制中异步复制导致复制滞后带来的一些一致性问题。 3,懂不懂数据库中按行,按列啥的忘了? 4,ACID的概念 5,lambda和function的区别,与function ptr的区别? 6,进程,线程,协程的区别? 7,什么时候会出现segment fault?数组越界一定会导致se
56分钟;c!果然大数据 1. 自我介绍 2. 压缩数据1a2s……和压缩数据2a3b……对比,是不是一个数据 3. 手写单例 4. java中如何限制内存大小;Java内存结构;你说的这个限制是限制Java中全部的区域的嘛? 5. 有两个数据集,一个中有100条数据,一个中有10000条数据,求交集,注意内存大小!! 6. 有20个文件,每个1GB,里面有很多关键字,对关键字进行集合求出现的次数
面了很久,有100分钟,面试官很认真。 介绍项目 MR的shuffle流程 数据倾斜怎么处理,实际处理过数据倾斜吗(我特老实,我说我没有) spark的宽窄依赖,为什么要划分stage 抽象类和接口的区别 hive的四种排序(简历也没写hive,为啥逮着我问) 问了mysql相关 我简历上所有的组件问了个遍,redis spring druid mybatis,可我当时没准备,就没答出来。。。 设
一面:50min 主要是针对简历提问,几乎每个点都问了 1. 自我介绍 2. 介绍项目 3. 某预测类项目有继续测试今年的数据吗 (自己给自己挖的坑,简历里写了会c++) 4. 对c++的内存分配有了解吗 5. 程序运行的流程是什么 4. spark和flink的区别是什么 5. 简述spark原理 6. spark和mapreduce的区别是什么 7. 对hive有了解吗 8. 数据倾斜的产生和
硕士研究cv 可能和数据挖掘不是那么匹配~ 大华一面(1h): 1、增量学习的科研项目(问了具体的细节 以及为什么) 2、语义分割的发展 3、UNet中的跳跃连接的作用 4、残差网络的shortcut连接的作用,数学方面证明残差网络可以避免梯度消失,并且问了一个关于残差网络的改进问题(面试官看最新的论文看到的,我没有理解他所说的问题) 5、宫颈肿瘤分割和pcr预测的项目(细节也问的很详细) 6、预
得物面试基本都是一面,全程差不多半个小时。结果一般一到两个工作日就会出来,所以效率还是很高的,就是喜欢这种干脆的。 1.自我介绍:我是分以下几部分介绍的(仅供参考) 1:学校 专业 绩点排名(不高的话可以不说)获得奖学金等。 2:课外参加的一些竞赛获奖情况。 3:实习经历(简单介绍即可,比如有过几段实习,分别是什么岗位。不用太详细,后面他会根据简历详细问你的) 4:为什么投递该岗位。表达对该岗位的