周日一点面试,真血汗工厂。
面试官态度很棒,值得表扬。
上来手写最长递减子序列,写了nlogn的贪心和二分,被询问数组里存的什么,询问时空复杂度。
询问两个项目,包含具体技术和衍生问题。怎么量化指标的,为什么要这么做。
介绍transformer的详细流程。
谈谈位置编码,回答了RoPE。
谈一谈对transformer的QKV的理解。
transformer中多头注意力的QKV是一个吗。
残差连接为什么要加上恒等映射。
BN和LR的功能和区别。
对L1和L2正则化项的理解。
优化器了解吗。
给定一些含bias的全连接层,计算参数数量。
算法:
1、如何求第k大,回答线性复杂度的快排。
2、给定一个流式整形输入,求中位数。这个不大会,口胡两个单调队列,面试官回应思路大体正确。
面试官说算法是大类,所以问的问题很泛。