9.11 一面(30min) 纯八股: 介绍下hadoop(hdfs、mapreduce、yarn) 介绍下hbase 介绍下flink flink checkpoint、connect和union的区别、flink如何处理数据倾斜 介绍下kafka kafka如果有台机器挂掉会发生什么 链表反转 面试官全程表情和语气冷淡,体验不是很好..当然答得感觉也很一般
个人情况:本双一流硕211非科班,一段搞深度学习的实习。项目自己做的。全程面试被追问麻了面试官有问题必追问 自我介绍 项目深挖(20min) 实习工作介绍(5min) 数据倾斜有哪几种解决方法 Group by 倾斜,join倾斜,null值倾斜 分别说说这些倾斜怎么解决:全说上来了,面试官问:还有呢?。。。开启负载均衡,对小文件进行合并,对数据类型进行检查,还有呢?我就记得这些了 Hdfs小文件
部门:优选事业部-美团买菜 timeline: 8.24 一面 8.28二面 8.31 hr面 9.7 oc 一面: 项目介绍 什么是指标体系 指标体系包含元素 指标分类 数仓分层、分层好处 数仓分层和指标分类之间有什么关系 什么是总线矩阵 什么样的数仓是一个比较好的数仓 什么方法可以落实上面说的数仓 缓慢变化维;除了拉链表还有哪些方式 什么情况下可以使用map join 怎么解决数据倾斜问题 J
1. 自我介绍 2.项目介绍 3. 你的项目有用到很多微调方式,能给我解释一下吗?(lora pv2 prompt tuning 等) 4. 能详细介绍一下 Transformer 结构吗? 5. bert 在训练的时候, 如果一个 batch size 的内容长度不一样, 这个怎么解决?(我说的加 padding token) 6. 那加 padding token 会不会对计算结果有影响? (
纯纯kpi面试,十几分钟就结束了... 大概问题如下 自我介绍 1. 什么时候开始接触Java,什么时候决定把Java作为未来的方向?怎么学习Java的八股 2. Java的三大特性? 封装继承多态 具体讲一下这三个特性 3. Java支持多继承吗?不支持,从开发的角度说一下为什么不支持多继承 4. ArrayList的优缺点 支持随机访问,支持顺序可重复 不支持线程安全 5. LinkedLis
面试流程主要包括: 笔试、业务一面、业务二面 笔试主要考察一些性格、行测相关内容 业务一二面主要聊产品、思考等等内容,有空再完善下。 已成功入职 内推找我
1. 自我介绍 2. 介绍项目,简单问一下。比较看重底层 3. 打开leetcode,屏幕共享做了一道链表的中等题 4. 问了操作系统、c语言、计算机网络、硬盘管理等 整体强度不小,没有抓住一个问题深挖,回答之后马上下一个问题。 整体大概45min,流程应该二到三面
1.自我介绍 2.微任务,requestAnimationFrame,requestIdleCallback 3.chrome调试工具,怎么定位问题,sourcemap 4.微前端,monorepo 5.websocket 6.闭包有哪些场景 7.vue3数据绑定原理 8.白屏检测怎么做的 9.性能优化 10等等等等,聊天为主,基本上简历上这啥就问啥
部门:互联网事业部-深圳 职位:客户端开发工程师 平台:腾讯会议 45min 风格:先问项目后问八股 #面经# #秋招#
大概面了90分钟,项目拷打,问了一堆框架,啥也不知道,狠狠的自闭了。 分布式存储的框架有了解吗?比如哪些开源的框架? raft算法讲一下吧 向量检索的方法了解吗?有哪些开源的? 模型的网络加速方法了解吗? 大模型了解吗?原理和部署方式是怎样的? 单指令多数据SIMD了解吗? 有把项目或服务部署到移动端过吗? GPU了解吗,平时有没有用到? 写题:链表局部翻转,基本实现了,还有点细节没处理完,被叫停
自我介绍 数据倾斜问题 spark的shuffle相对于mr的shuffle有什么区别 spark的stage怎么划分的 yarn中都有什么,作用是什么 hdfs读写流程 rpc和http分别是什么,有什么区别 项目中都有什么数据 数仓的分层,每层都做了什么事 反问 金风科技二面总经理面 自我介绍 总经理问题: 1.本科和研究生都是通信,为什么选择大数据 2.怎么在完成学业同时学习大数据的 2.对
总体情况 讯飞自研平台,视频面 40余分钟 无手撕 具体问题 以下相关问题并非按序,而是整理时重新分类了 个人情况相关 自我介绍 老家哪里 希望在哪发展 专业是啥? 为啥想做Java后端 学校课程 项目 ==项目如果要上线需要做哪些地方的改造== 集群、高可用session共享问题 引入Kafka做什么 出于什么考虑发送kafka消息之后谁监听? 八股类 Java基础 面向对象和面向过程的区别 面
【30min】自己提到推荐领域和数据挖掘领域,直接就问了两个领域比较熟悉的算法有什么,大概介绍一些 不会的: 1. XGB shrinkage 2. FM 算法为什么时间不高 3. 如何将用户之间和物品之间的特征加入协同过滤中(随便说了,特征拼接) 比较明确的问题: 1. 随机森林,提升树的区别 2. 随机森林如何构建?特征采样的好处 场景题 1. 给出手机的BOM结构图,对于预测手机销量和原材料
闲来无聊,发一个加州湾区的DS面经,和国内的面试题差别挺大的。 1.对于下列预测分类任务,AUC是不是评价模型的好指标,为什么?1. 预测一张图片是否显示了一只猫。2. 判断一辆汽车是否存在罕见但非常严重的制造缺陷。 2.您正在建立一个模型来检测一种罕见的属性(称之为 Prop),这种属性只影响不到 0.1% 的网页。您可以使用哪些技术来确保您建立的模型不会偏向于假阴性? 3. Softmax方程
65b最近很累了,问了半天发现是校招的,不是社招的 面试时长:40min 面试内容: * 自我介绍 * 实习介绍 * raft协议 * redis一致性 * AI框架前端 * avl和b+和红黑树 * tcp粘包 * reduce优化 * copy on write * 零拷贝 * 堆查找元素 * 模板结构体 * 智能指针具体使用 * 完美转发和右值 * 协程调度 * sm、block、warp