6.30一面(40分钟作用)
1.自我介绍
2.jieba分词的原理
3.word2vec的原理,怎么训练的
3.有没有了解chatgpt是怎么训练出来的(项目涉及)
4.简述bert模型
5.pytorch中的train,val模块
6.怎么爬维基百科的,一天能爬多少条
7.在爬数据的时候有遇到哪些反爬的机制
8.MySQL数据库的存储引擎,索引类型(聚簇索引、二级索引)
9.为啥想做AI
10.python中字典的结构,是用啥实现的
11.有一组无序数组,怎么取前10个最大的数
之前看面经说是归并排序,但hr说这不是最快的方法。
12.反问
不太了解nlp的,感觉大概率凉了。。。