1.自我介绍 2.算法原理: 简历上所有算法原理。 工资不高,面完秒挂。 (面试官不是很专业,有点不偏好数分的来搞算法)
面了大概一个小时,我自己生病了挺不舒服的,面完就睡了,所以面经有些地方可能记得不太全 1.自我介绍,边介绍边问 tableau中如何反转矩阵(行列交换),问这个是因为我写了我会tableau 我在介绍AB test和因果推断的时候,面试官说我们用不上这些,我们主要是做模型和算法 对实习中的ETL开发任务问了一下,然后问了一下Hive SQL熟练度 实习中是如何处理大规模的稀疏矩阵的 实习项目中的评
岗位JD看起来不像是数据科学家,而像算法工程师 一面: 深挖项目 介绍一下Bert模型 树形模型是如何计算每个特征的重要性的 对项目里用到的遗传算法深挖,问我是如何改进遗传算法的 特征选择中,前向选择和反向选择实现起来有什么区别,哪个效果更好 如何构建多模态模型 在多模态任务中,如果视觉模型的输出张量比语言模型的输出张量短很多,该进行什么操作 介绍一下transformer transformer
前面的IEG秒挂后2天被这个部门捞了,这几天准备了下算法,但是项目有点懈怠了 时间:3月11日 14:40 ,时长45分钟 全程拷打Java项目,掺了一些业务相关的八股 拷打查询优化细节: 因为项目亮点手贱,写了用Redis缓存优化前时间、优化后时间。结果疯狂拷打怎么得出的优化时间 其实是编的数据😭😭,引以为鉴!! ⭕查询时间是怎么测出来的? 肉眼对比效果 + 查询前时间 对比 查询后时间 ❌
整体的面试内容会结合项目和实习经验进行提问,面试官人很好,问题也是由浅入深。 有监督学习和无监督学习的区别 过拟合的处理方法 梯度下降法原理 损失函数作用 实习的主要内容 ES中索引的类型和作用 ES的优点 mapreduce的原理 还问了一些数仓的知识 没答上来 数学建模 模型的类型(记得好像是这样 一道简单算法题 反问
6.30一面 面试官很nice 1专业相关 为什么要跨专业考研 具体的专业在实际中的应用 2 问了个简单的sql 写错了 面试官一步步提醒终于写出来了 3 口述用栈 实现计算器功能 7.1 二面 1 简单sql 2 数仓理论 3 数据倾斜处理 滴滴面试官都是很有耐心 一步步提示你 解决问题 就算面不过体验也很不错。 7.11收到offer了
阿里 数据研发 8月底 一面 9月中 二面 30-40min,面试内容都差不多 大数据:hadoop了解多少?讲讲mapreduce,其中有几次排序?hive?hive调优? 数据仓库:星型,雪花,星座模型;数据分层 -- ODS,DWD,ADS,作用(我回答承上启下) 手撕SQL:窗口函数,查找连续三天的记录 等等数据仓库和大数据的问题 开放性问题:服装厂秋季生产什么样子的衣服? 实习经历,内容
一面:投的数研,实际数科 1.自我介绍 2.实习内容 3.实习团队架构 4.map reduce原理 5.数据倾斜有没有遇到过?怎么解决 6.ab实验原理、流程、如何分析 7.假设检验原理 8.口述sql题目:求连续登陆三天的用户 9.假设检验概率论场景题:求置信区间 10.常用的机器学习算法 11.随机森林原理 12.求职意向,数科还是数研,安排下一轮面试官(回数研后第二天结束流程) 13.反问
一面 常见数据结构 维度建模 事实表建模 工作中维度建模是怎么处理 三种事实表的区别 mapreduce原理 hdfs读写流程 增大资源是否会有限制 是否遇到过数据倾斜 二面 数据倾斜 数据治理怎么做的 职业规划 爱好 三面 主题域 数仓建模 bucket join
一面 1.自我介绍? 2.为什么从数分做数开? 3.你觉得数分和数开有什么区别? 4.spark和hadoop哪段实习接触的? 5.讲一下mr和hive原理? 6.hdfs中,一个block大小和通常配置个数? 7.用spark还是用hive?spark比hive好在哪里? 8.spark既然是基于内存的,那么内存不够怎么办? 9.数据倾斜? 10.uid粒度和did粒度用在AB不同的场景是指什么
一面:50min 主要是针对简历提问,几乎每个点都问了 1. 自我介绍 2. 介绍项目 3. 某预测类项目有继续测试今年的数据吗 (自己给自己挖的坑,简历里写了会c++) 4. 对c++的内存分配有了解吗 5. 程序运行的流程是什么 4. spark和flink的区别是什么 5. 简述spark原理 6. spark和mapreduce的区别是什么 7. 对hive有了解吗 8. 数据倾斜的产生和
面试时间:2022.7.27 岗位:系统研发工程师 总共14分钟的面试时间。 自我介绍 去过哪些公司实习?为啥本科毕业那年没去实习? Cache内数据存储格式,和内存之间怎么进行交互? C++ oneway关键字的作用 OSI七层模型 SSL在哪一层? TCP四次挥手。Server是否可以主动断开连接?主动断开要几次? TCP的拥塞控制算法 算法题1:单向链表,如何反向读取? 递归,用栈空间,时间
saas平台,商城商品模块相关表设计 交以下内容 初始化数据 1.表数据字典 2.生成语句 3.自行模拟的数据导入语句 业务数据 1.后台新增语句 2.后台修改语句#秋招#
#互联网公司爆料# 58笔试通过但面试没有过,面试我的人首先问的还是数仓建模,我当时这方面还是刚学,不是很懂,问的建模细节还是不会,直接挂了,但整体还是可以的,薪资估计16起步吧,双非本科估计就是最低的白菜价
题型:20道选择题,3道编程题,其中第一题写SQL 笔试太难了?可以私信我 有些AC有些通过率还行,助攻已经进面了 选择题: 下列排序中需要额外辅助空间的期望值最大的是() 堆排序 希尔排序 快速排序 冒泡排序 双十一快到了,某服装厂为了赶制订单,加班加点使用设备生产衣服。如果某一设备在时间长度为的时间内发生故隙的次数服从分布N(t)~P(λt) (H松分布),求该设备在无故障工作8小时后再次