写面经 攒人品 1.介绍项目; 2.秒杀项目如何保证高可用; 3.Redis在项目中的作用; 4.Redis的持久化机制; 5.针对项目哪些部分进行测试; 6.优先保证业务还是优先保证系统稳固; 7.一个微服务项目多个进程进行通信采用什么样的方式最快; 8.乐观锁悲观锁 弊端 什么情况下乐观锁效率比悲观锁低; 7.科研课题 模型参数规模 如果数据中有噪声如何处理;
Timeline: 10.9 投递 10.24 笔试 11.4 一面 一面 20min: 1.自我介绍 2.专业课程 3.微分中值定理 4.竞赛经历相关 5.皮尔逊和斯皮尔曼相关系数 6.随机森林 7.数仓项目相关 8.指标体系建设 9.数仓分层 10.空值填充 11.常见统计方法 12.统计量 13.长期历史数据如何保存 面完挂 方向不太匹配 偏数分#数据人的面试交流地##24届软开
一面 10.10日 1.5h(一面挺难,像cto) 自我介绍,讲一下大模型应用项目(我讲的nl2sql的项目) 项目背景,总体思路,解决什么问题,指标是什么 细节拆分: 1.数据集怎么构建的,什么规模,有没有质量评估 2.模型底座是什么,这些不同底座什么区别,什么规模 3.训练方法,用的什么sft,有什么不同,有什么优缺点,原理上解释不不同方法的差别 4.评估指标是什么,这些指标存在哪些问题 5.
有无论文专利 平时除了C++和Python,还用过其他语言吗 谈谈你对面向对象的理解 指针和引用的区别 声明和定义的区别 C和C++中struct的区别 覆盖和重载的区别 线程生命周期中可能出现的状态 线程同步互斥方式 i++、++i是线程安全的吗 C++中如何创建线程 stl中vector和map是线程安全的吗 C++中如何捕获信号 socket中如何指定TCP还是UDP传输 如果服务端接入了很
1.工作经历; 2.java体系有什么,最近在学什么,(说线程池,就一直问线程池)接下来学什么? 3.如何学习新知识; 4.如何尽快融入新项目中; 4.秒杀流程,如何减库存; 5.如何解决几万人同时秒杀问题; 6.jwt作用; 7.线程池任务队列如何保证线程安全;ArrayBlockingQueue; 8.线程池的执行流程; 9.线程池的饱和策略; 因个人设备问题迟到十几分钟无了.
内容涵盖C/C++,数据结构,计算机网络,项目,操作系统,数据库,设计模式,场景,场外;纯纯的八股拷打,整整问了70min不带停,狂轰滥炸式的进攻,第一次面试过程中有种想逃离的感觉,面完感觉身体被掏空~ 开局笑嘻嘻 自我介绍 你们实验室是国家重点实验室不? 科研项目,有没有发论文和专利 有没有实习? Linux操作系统 如何创建线程/进程? 线程间通信;如果有两个线程计算出一结果,怎么通知第三个线
0824 面试感觉良好,但是感觉答得一般,有很多东西太久没接触了,不大会了。面试官没有开摄像头,会不会是 KPI 啊 没有手撕,全八股,下面是一些问题关键词,没有分先后顺序 1.自我介绍 2.Java: - 重载、重写的区别 - final - hashmap - concurrenthashmap - AQS,我讲了 ReentrantLock 的非公平锁和公平锁,但感觉讲的有点磕磕巴巴的。 -
mapreduce中有哪些排序 yarn的事件驱动 hbase写热点问题 建表时怎么指定空region spark sql中dataframe怎么把表中的字段提取出来 hive怎么提取出来 yarn中的container怎么实现 写一个sql,学生不同学科的得分排名前三 手写单例模式,策略模式,工厂模式,并描述在什么场景下使用,口述一下装饰者模式 arraylist和linkedlist的区别,什
hdfs读写流程 spark内存管理 项目中遇到的问题,怎么解决的 项目中都有哪些表 怎么处理缓慢变化维 拉链表怎么做,开链闭链怎么 数仓和数据湖 维度建模,星型模型,雪花模型 数据倾斜,小表join小表,大表join大表 遇到过的数据倾斜,怎么做的 手撕,二叉树中序遍历,非递归写法
时长28min 自我介绍 问了问我本科(因为我本科城市轨道交通运营管理)跟计算机相差比较远 项目收获 负责了什么 遇见了什么困难,怎么解决的 对未来的规划 最近在学什么东西 讲一讲你学到的 用过什么数据库 怎么了解讯飞的 反问 什么部门 培养机制 总结:没啥技术问题,感觉面试官应该是管理层。 真心许愿hr面 #科大讯飞求职进展汇总# #科大讯飞信息集散地# #我发现了面试通关密码#
数据倾斜问题 写个sql吧 再写一个sql吧, 写挺好啊,在写一个吧 这些你是练习过原题吗,在写一个sql吧 说一下数仓的分层,每层干了什么事? 说一下归并排序的过程 xgboost原理 线性回归,逻辑回归 聚类了解吗 说一下spark怎么实现map join
本人只做点业务数据sft, 做的更加偏向于粗糙业务,直接被拷打麻了,望佬看到可以给我指点一下 1. 现在有一个非常完备的sft指令集,你只能选择1w条,你如何选择数据来使模型的能力更加提升+完备? 2.我们知道sft的时候尽量不要注入知识给模型,因为只希望sft可以提升模型的指令遵循的知识,注入知识的话,可能会导致后面使用的时候模型容易出现幻觉,那我们怎么确保自己选择的这1w条数据没注入知识给模型
中国电子技术标准化研究院(大模型方向) 1.自我介绍 2.了解rag吗?简单介绍一下 3.Rag流程是什么? 4.做过微调吗?怎么做的? 5.大模型训练的超参数是怎么选的?学习率是什么?一般设置为多少? 6.Lora和qlora的区别? 7.训练时的pt是什么?(不记得是不是pt,这个真不知道) 8.情景题:假如有一万个PDF文档,要做垂直领域的大模型,用什么方法?具体怎么做?(我觉得可能是公司的
智谱的面试总是很简短啊,也不写代码,都搞不懂怎么过或者不过的。 1.自我介绍 2.聊实习内容 rag 这块做了什么? 你们的场景具体是啥? 你的工作里有涉及到训练模型的吗?讲一下(细讲) 你有了解过智谱的模型吗? (讲了一下 GLM) 你觉得 GLM 第一代的特殊结构有啥优劣?(就是 prefix LM 嘛,其实很多细节忘了,就凭着记忆讲了一下,训练任务关注上下文,mask 有一部分全 1) 有了
1.介绍项目,详细说一下实习期间参与的项目的具体工作,个人担任的角色 2.go协程和线程的区别 3.左值和右值的区别,衍生到左值引用右值引用 4.右值经过资源转移过后是否被销毁? 5.转移过后得到的值还是右值吗?它的生命周期是怎样的? 6.模板函数在哪个阶段实例化? 7.vector实现原理 8.vector什么时候动态增长 9.空vector有大小吗,大概是多少? 10.内存对齐 11.全局静态