被拷打1h30min
1.自我介绍
2.详细介绍一下实习的项目,从数据构建,benchmark构建到最终取得的效果
3.stable diffusion的结构与原理
4.项目里设计的模型与原始SD结构的差异,具体通过什么方式实现
5.做一下题目:
1.手撕transformer里面的cross attention与mask-filled 的self attention,可以用torch,最好不用nn.Multiheadattention,自己定义输入q,k,v
2. 给定二值图像,找出两个不连通的图形,分别是五角形与圆形,输出位置坐标与类型,不能用opencv等图像处理库。
6. 回到八股
CNN与transformer区别
为什么transformer可以更好建模长距离依赖
CNN提升全局信息利用最简单直接的方式
说一下分割的代表性架构与前沿研究,FCN系列和Transformer系列,优缺点
说一下目标检测的代表性架构与前沿研究,优缺点
反问
手撕基本只能撕一半,感觉凉,强度很大,不愧是宇宙厂。其他问题基本答的也还行
#晒一晒我的offer#
#字节跳动##计算机视觉岗##算法#