项目介绍 此项目是机器学习、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。 既然是以面试为主要目的,亦不可以篇概全,请谅解,有问题可提出。 此项目以各个模块为切入点,让大家有一个清晰的知识体系。 此项目亦可拿来常读、常记以及面试时复习之用。 每一章里的问题都是面试时有可能问到的知识点,如有遗漏可联系我进行补充,结尾处都有算法的实战代码案例。 思维导图,请关注 AI
awesome-nlp A curated list of resources dedicated to Natural Language Processing Read this in English, Traditional Chinese Please read the contribution guidelines before contributing. Please add your
为中文自然语言处理领域发展贡献语料 贡献中文语料,请发送邮件: CLUEbenchmark@163.com *** update **** 中文任务基准测评,10大任务 & 9个模型一键运行、详细测评: Language Understanding Evaluation benchmark for Chinese(CLUE benchmark): run 10 tasks & 9 baseline
nlp-tutorial nlp-tutorial is a tutorial for who is studying NLP(Natural Language Processing) using Pytorch. Most of the models in NLP were implemented with less than 100 lines of code.(except comments
awesome-chinese-nlp A curated list of resources for NLP (Natural Language Processing) for Chinese 中文自然语言处理相关资料 图片来自复旦大学邱锡鹏教授 Contents 列表 1. Chinese NLP Toolkits 中文NLP工具 Toolkits 综合NLP工具包 Popular NLP T
python-nlpir是NLPIR的一个python封装。NLPIR是目前运用最为广泛的中文分词工具。目前该软件支持Windows和Linux。
一面挺好说话的哥们(过) 1、简历深挖 句向量具体怎么样优化? 在哪几个模型上做的? xlnet相对于bert的改进? 有无中文数据集的经验? 遗传算法怎么改进的? 强化学习如何做的? 了解以前智能对话的技术不,如lstm等 了解单轮对话和多轮对话的区别不? 如果了解,你觉得多轮对话的难点在哪? 可以如何改进? 2、反向提问? 客服业务量怎么样? 算法团队情况? hc岗位的具体职责? 二面 技术主
一面 简单挖简历 你的三个项目怎么做的? 讲一下cnn? 讲一下lstm? 讲一下反向传播? 讲一下sigmoid函数? 讲一下逻辑回归和随机森林的优缺点? 讲一下svm? 在线共享codding—求一个正数的平方根 在线codding,求链表的倒数第k个位置的value,由于时间原因只说了思路 二面 中度挖简历 三个项目的部分细节? 第一个项目后续优化的思路? 讲一下你对大模型的理解,知道哪些大
1. 自我介绍 2. 简历内容项目细问(每个和NLP有关的都问了) 3. 了解哪些大模型 4. 介绍BERT 5. 相对位置编码的好处 6. 介绍Word2Vec和优化方法 7. BERT为什么用LayerNorm不用BatchNorm 8. 算法:找出和为给定目标值(target)的连续子数组 最后一道题忘记双指针可以做了,只想到暴力dfs了感觉题刷的还是不够,面试一紧张就容易做不出来 #滴滴#
8.8 二面 45mins 1.介绍意图识别模型工作 2.介绍多模态模型的工作 3.介绍llms的tool learning;检索增强的一些微调结果 4.介绍论文——对抗样本 5.反问:岗位主要做提升文心一言的问答和检索增强任务。 没有代码;没有八股;感觉像是KPI面 #百度信息集散地##百度#
8.8 一面 50mins 1.介绍一下blip2的架构;你觉得blip2的优势是什么;和之前的多模态模型有什么区别? 2.是怎么在电商领域微调的? 3.模型蒸馏是怎么做的?有试过无监督样本训练吗? 4. 手撕代码,一个元素在一个有序数组的第一次出现位置。 #shein#
或许是这个团队比较缺人,面试官比较着急面试,所以一面和二面是挨在一块的。 一面: 1. 自我介绍 2. 实习&项目拷问 3. 手撕代码环节:① 给定字符串例如aabbbcaa,把它转化成2a3b1c2a的形式(双指针就可以解决)。② 给定一棵二叉树,对每个节点的左右子节点进行softmax(需要自己写softmax函数,不太懂这题的意义是什么?)③ 给定一个严格单增的单链表,首尾拼接形成环形链表。
说实话没有太多可以讲的,没有算法题,主要就是谈我在实习的一些业务经历,解释了不同业务间的联系和区别;然后聊了一些对于搜索策略组未来可能发展方向和模式的畅想,以及未来的人生职业规划等等,时间一共35分钟。等待offer中。。。。
8.1一面1h➕45mins 面试时间最久的一场 简历上项目问了个遍,问了一个小时 手撕字典树,卡了半小时不会写 手撕最长公共子序列 如何评估两个文本的相似度 人要面傻了,面了这么久 面完发现状态秒变共享中 #百度信息集散地#
7.25二面半小时 1. 介绍你最拿得出手的一个工作 2. 介绍实习工作 3. 有没有关注过机器翻译方向 4. 无重复数字的全排列,口述算法思路。 5. 一些别的个人情况介绍 #OPPO信息集散地#