深圳 一面挂
基础知识:
1、transformer的位置编码了解吗,有什么位置编码?
2、注意力机制有哪些变种?
3、tranformer的改进。
4、对其他推理有没有了解?
场景题:给一个一千万的文档和一百万个词,在每个文档中匹配出存在的单词,怎么做?
对hadoop和mapreduce有了解吗?
手撕代码:递归二分查找
北京 一面
介绍transformer、我的论文聚类算法用的哪一种、有没有改进、图注意力怎么做的、word2vec的两种结构、逻辑回归的损失怎么推导计算的、介绍决策树的三种算法、手撕三道算法题(链表算加法、简单dp、最小银币组合数dp)、过拟合的原因有哪些?怎么解决?数据增强介绍一下。
北京 二面挂
自己选一个项目介绍,然后聊了半小时项目。
写了一道题,小偷偷东西,但是不能连续偷相邻的屋子,问最多可以偷多少金额。
我用的是dp做的,二层循环。但是面试官说可以这不符合dp的思路,虽然结果是对的,但是会重复计算一些结果。