双方都没开摄像头,问需要开摄像头吗,回答不用。
首先自我介绍 我的自我介绍比较简略,以至于面试官有点无语
先介绍两个声纹的研究项目,深挖,问得很细,面试官非常专业,直接问到了实现过程中的难点和从创新点上提出的一些质疑,自认为回答的还算清楚。问了投的论文。
问了我论文结构里的池化方式
之后问我了不了解Ecapa-TDNN,说一下模型结构,我说了残差连接,多尺度融合,基于注意力的池化和AAM-softmax loss,忘记说Res2Net的block结构,面试官提醒并反问res2net的结构,有点忘记内部结构了就说了残差连接不一样,一笔带过了。
问我silk的编码怎么解决跨信道,然后问我跨信道的声纹识别怎么做,数据增强和域自适应,问域自适应如何实现,对抗训练,用grl实现,问grl全称,梯度反转层,grl与多任务的区别?一个是loss加权和,一个是说话人loss减信道的loss。问只是相减吗?不是,减号后面有一个从零到一递增的系数,否则很难训。问我交大一篇论文,我说我看过,我复现了他们的方法,问结果怎样,好不好,我说确实好一点。面试官笑了笑说我看的还挺多。
然后问为什么投苏州和上海,主业务都在合肥,我说合肥也很不错,意向城市当时随便填了两个,对城市没有什么要求。
反问问题:1.声纹这一块的业务
2.工作忙压力大的时候怎么平衡工作和生活
整个下来无手撕算法题,无八股,纯聊天
——————————————————
9.16 约二面,9.17二面
——————————————————
二面全程问的开放问题
问了text-dependent 和 text- independent,为什么td好
有些是别的领域的一些迁移,答不上来,问的都是非常新的技术,比如预训练大模型,这些平时也没做过,感觉自己二面答得不太好,本来45分钟,25分钟就结束了,难顶,感觉凉凉
最后问了代码能力,问笔试感觉怎么样,问我用什么框架,问我觉得我实现的比较体现代码能力的东西
反问
先问了一个技术问题
然后问了当地的工作环境
下周看什么结果吧,感觉有点凉,二面被问到了好多自己不会的问题,现场思考答得磕磕巴巴
——————————————————-
二面凉
#面经##秋招##校招#