时长:1h30min 因为岗位比较匹配所以问了不少,鼠鼠第一次面这么匹配的岗位,面试官很有水平,学到了很多东西。 1.自我介绍 2.深挖项目和实习,简历上提到的都问了,中间穿插了八股 1)具有旋转不变性的图像算法 2)transformer中为什么除以根号dk?dk怎么来的? 3)传统的图像处理方法有哪些? 4)滤波,去燥 5)中值滤波用在什么地方? 6)哪些滤波能保持边缘信息? 3.手撕lc69
格灵深瞳一面,CPU 都干烧了 面试时长:60min 1.自我介绍 2.你觉得笔试哪里做的比较好 3.简历中挑一个你最熟悉的项目介绍(我挑的单目变焦三维重建) 4.如何实现单目变焦三维重建的 5.SLAM 懂一点吗?说一下基本流程 6.讲一下如何准确建图 7.稀疏重建如何去畸变使得图像畸变影响最小 8.图像畸变的原理 9.如何计算图像位姿,本质矩阵如何得到 10.图像特征匹配中 RANSAC 方法
小硕一枚,有幸笔试做两道被美团捞简历,成为第一个暑期给面试的公司 流程: 1.面试官介绍部门做什么的,视觉智能的,现在在做中文的文字可控生成 2.我自我介绍,介绍一下简历上一个印象深刻的项目 3.掰扯一些论文的做法,(他不懂) 然后问我如何端到端训练风格迁移,用扩散模型 4.乱扯了在快手做的事情 5.如果让我做可控文本生成,我会怎么做,发散问题(不会,实在不懂) 6.缩小范围,字体风格迁移要怎么做
问是否是面试实习岗(否 针对简历中的项目进行提问,重点是深度学习模型相关,模型结构 询问项目的细节 最后给俩道中等难度算法题,一道二叉树,一道链表 都没做出来,持续尴尬,面试40多分钟就结束了 刷题去了
##好未来#秋招:一面面经,应该是凉经,趁着热乎记录一下。 1、30分钟的项目,根据你的简历上的项目进行提问,问的地方比较细,也会问你对这个方向的一些看法和理解。 2、5分钟左右的八股,但是这个八股主要还是涉及到多模态大模型的部分,我不太了解,只是在一个项目中用过多模态大模型,所以这部分比较快 3、手撕,竟然没手撕力扣的,手撕一个分割的评价指标,我主要做检测的,分割很久不碰了,不过在帮助下还是磕磕
自我介绍,双方的,(我对阿里国际确实不了解) 问想要未来工作的base地 先来两道题,leetcode 11。leetcode爬楼梯 介绍一篇论文 知道vit吗 知道多模态吗 反问:1.卡多少(一千多张H100) 2.做什么(虚拟试衣,多模态,基座大模型)3. hc多少,暑期实习有10个,卡不能停找的人会比较多 4. 做research吗?(是的,一年以来业务做的很多了,现在需要技术的攻关) 全程
8.2 测评 8.26 一面 所有项目逐个介绍(细挖) ResNet中的BottleNeck结构 9.7 HR面 自我介绍 项目介绍 家庭情况 父母对自己工作的期望 研究所和企业工作的选择 职业规划 对象问题 读研期间导师对自己的影响 自己的性格介绍 自己的缺点 薪资意向 岗位的理解 反问 9.28 录用评估 #海康面试#
问题内容: 我目前正在开发用于可靠手部检测的系统。 第一步是拍摄手的照片(在HSV颜色空间中),并将手放在一个小矩形中以确定皮肤颜色。然后,我应用阈值过滤器将所有非皮肤像素设置为黑色,并将所有皮肤像素设置为白色。 到目前为止,它运行良好,但是我想问一下是否有更好的方法来解决此问题?例如,我发现有几篇论文提到白人的具体色彩空间,但没有一篇对亚洲/非洲/高加索色调进行比较。 顺便说一句,我正在通过Py
问题内容: 作为一名实际的开发人员,我想为我的特定任务制定一个很好的算法,该算法是从诸如“边界提取”或“伽马校正”之类的块构建的,但是我不想实现这一点,因此那东西,所以我徘徊-是否有任何强大的CV库,例如C ++的OpenCV? 说“最好”,是指具有以下属性的库: 实现了许多不同的算法 可扩展性-我可以在库方面创建新的东西 高性能 线程安全 问题答案: 萨满,我一直在寻找与Java中的opencv
题型:10 单选+10 多选+10 判断 由于只记得部分题目,所以题号可能对不上,见谅 1.lidar slam 点线匹配自由度(答案:3) 2.图像分辨率缩小一半,内参变化(答案:除了畸变系数,fx,fy,cx,cy 全部减半) 3. a=np.random.randn(3,3),b=np.random.randn(3,1) ,c=a*b,问 c 等于(答案:因为第一维相同,第二维度不同,且有一
一面 总的来说问的挺简单,半小时就结束了 1. 前20分钟基本上都在问项目,问文章,创新点,整个就是我在介绍,然后面试官嗯嗯嗯,时不时提一个问题为什么这么做之类的,好处是什么 2. 一些比赛和文章用到的模型 YOLOv5怎么做检测(从backbone(CSPDarknet,SPPF),neck(FPN+PAN),head(多个特征层做预测)分别介绍了一下) 怎么做正负样本匹配(v4里面是计算IOU
问项目 目标检测 对目前常用的目标检测算法有接触吗?比如Fast-RCNN,Yolo系列的,RetinaNet Yolo v1 和 v3的区别? 先验框anchor的方式,anchor based和anchor-free,两种方法的区别 anchor-free的方式相对于anchor based有哪些优势 目标检测中一阶段和二阶段的检测算法有什么区别 为什么二阶段的比一阶段的精度高 深度学习训练
知乎链接 https://zhuanlan.zhihu.com/p/670347110 一面 11.12 50min 1.项目 2. Facal loss 3. Coding: (1) 连通块个数 (2) 实现NMS 二面 11.18 38min 详细聊了项目 15-20min 2. Focal loss 场景题: 给一堆图片数据,数量很多,但是里面一部分是噪声图片也就是标签是错误的,请问怎么训练
美团的IoT视觉组,主要是做基于监控数据的人物交互感知,技术栈基本也是检测、跟踪和人体关键点检测之类的 介绍之前的实习工作,多任务平衡怎么做的(数据和loss都调参),有没有学术上的解决方案(一般都会问这个) 自动驾驶的检测模型有没有根据一些corner case做一些针对性优化 密集行人场景存在遮挡有什么好的解决方案 这种遮挡情况下对跟踪的影响 神经网络的注意力机制 代码题:翻转二叉树 聊的整体
7.2 一面 专业问答环节 自我介绍 项目介绍 小目标问题及解决方法 精度的相对提升和绝对提升 双阶段和单阶段目标检测器的区别 Anchor-free和Anchor-base的区别 NMS在Anchor-free上是否有用 基于Transformer的目标检测框架介绍 像素级分类和语义分割的区别 关于NLP的最新进展 深度学习模型的部署 谈人生环节 对科大讯飞的了解 科大讯飞与自己的契合点 对人工