返校前最后篇面经 这两次面试官感觉都挺满意的,,估计能有offer了 百度大数据研发一面(就一面) 2.22 自我介绍 项目 1.爬虫和识别匹配的细节 2.爬虫异常情况 3.内部表外部表区别 4.数据量大小 5.推荐KNN模型距离的细节 技术 6.mapreduce计算过程 7.shuffle细节 8.数据倾斜原因和处理方式 我举了两种 mapjoin 加盐 9.hive窗
首先做了三道SQL题,主要涉及分组聚合、窗口函数。 3.3 一面 28min: 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min: 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran
时长:1h 由于问题太多,分四类进行整理 0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式 1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);
个人情况简述:本硕双非,acm银牌 测评答的个人感觉不错,笔试AK 测评隔天笔试(第一批),之后就跟大部队流程差不多约了一、二面 一面(总时长50分钟),二面(总时长40分钟) 纯业务理解,深挖实习经历和项目经历 提出的问题多为数仓设计问题和开放性问题,基本都是大量的对话和交流,因为很多想法是结合项目经验的临场idea,个人没有记录 携程给我的感觉就是,如果你做过很多项目,阅读过大量相关设计的学习
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验,求个好运 时长一个小时二十分钟 自我介绍 因为学统计的,问了中心极限定理和大数据定律 机器学习-XGBoost算法简介 两道智力题:逻辑判断谁说谎了和分金条 问了为什么研究生跨专业保研了? Hive和MySQL区别 数据库的索引有什么用 说一下索引的类型,还有B+树索引 数据仓库和关系型数据库区别 Hadoop生态圈简介 问我SQL写的
自我介绍 介绍项目 shell命令怎么调试 shell怎么获得上一条命令执行结果 shell命令怎么在后台执行 说说Linux多线程编程 说说Linux网络编程过程 手撕代码:反转链表 ps:寄了,太多东西不记得了 #我的实习日记#
#我的实习求职记录# 4.26 四道笔试: (1)写一个toast组件 (2)复杂嵌套对象根据id访问相应值 (3)数组去重的方法 (4)promise.all 1、position有那些值 2、除了settimeout还有那些定时器 3、settimeout怎么模拟setInterval 4、复杂对象嵌套你的写法,问题是什么 5、数组去重 set和filter有什么区别吗 6、promise.a
二面已经是交叉面了,面试官问的问题也都是跟部门业务比较相关的,会比较关心对于数据的抽象能力和归纳总结能力。大哥人很好很nice,后面讲解了很久他们部门的业务和对于实习生的一些期待 1. 简单自我介绍 2. 在科研和实习中是不是有一些可以通过数据分析解决问题的case分享 a. 介绍了xx实习期间的xx项目(toB) i. 追问如何熟悉了解工作中涉及到的系统的,有没有什么有趣的发现,或者通过数据找到
投的阿里其他三个志愿都简历挂,这次是被捞的。面了快1个小时,无手撕,6点面完8点就挂了 自我介绍 介绍webserver,有哪些功能,有哪些对标的项目 为什么要使用Reactor模式, 为什么不直接用多线程 线程池怎么解决存在CPU占用长的任务导致其他任务饥饿的问题(答了动态建立线程和线程根据任务分类,面试官不满意) 网搜答案:不同的任务使用不同的线程池,线程池中的任务应是同类的、独立的 主流电商
自我介绍后根据我的项目问我了一些问题,虚拟列表,懒加载,canvas怎么压缩的(这个没答对) 项目怎么实现鉴权的,我说的jwt,巴拉巴拉 然后又问了cookie, 问了防抖节流 项目跨域是怎么解决的(项目上线后用反向代理不太好) 问了数据类型,然后就问深拷贝浅拷贝,让我实现深拷贝 问promise,让我实现all和race方法 解释下事件循环机制 nextTick 总结:还是要多写写底层源码,回答
一面 面试官会一步一步引导, 也会给出自己的见解,体验很好 简单介绍一下自己 接口优化,讲讲背景,怎么做的 八张表同时并发去查的话,会不会对数据库的压力很大,有没有考虑这方面?数据库的负载怎么样? 什么情况会导致索引失效?索引命中的原理? select .... where b = xx and c = xx 会命中索引吗,怎么优化这个问题? 有个字段叫city,你觉得用city建索引合适吗 用单
好像是到店事业部的应用算法组吧,做的是具体 toB tos 的一些到店 app 相关应用,科研内容很少。 1.自我介绍 2.问大模型实习的项目 3.ChatGLM LLAMA QWEN 这些你都有微调过吗? 4.为什么你要用 lora 和 p tuning v2,有啥好处? 5.CHATGLM 的训练 loss 你知道怎么计算吗?(详细讲了一下 glm 的训练过程) 6.你了解 CHATGPT 的
1.问项目 2.数据倾斜,spark,hive,问的比较多。大多是简单的八股 3.问java很多(没复习,哭死) ①java的多态是怎么实现的、 ②java泛型了解吗 ③java反射了解吗 ④java垃圾清理机制是什么 ⑤java多线程了解吗 直接一问三不知 4.sql现场写代码
一、面试官介绍面试流程 1.自我介绍 2.根据简历询问问题 3.反问 二、自我介绍 三提问环节 1.选择你简历上一个模块介绍,怎么设计的 2.我说的登录模块,在账号前面加空格的一个测试用例,提问加空格是怎么考虑的 3.具体怎么测接口jemter 4.用fiddler或wireshark具体的使用场景 5.影响最深的bug,有没有了解原因,怎么解决的 6.我使用到的自动化,selenium怎么查找的
这个是我在某B开头的软件上投的,官网上好像没这个岗位 全程40分钟左右 1.没自我介绍,上来就是道代码题,是检测链表里面是否有环,正好鼠鼠做过,十分钟做出来了 2.介绍第二个项目,我的是个RAG的项目,介绍完面试官疯狂拷打,主要问了一堆数据处理的问题,有点难崩 3.介绍第一个项目,我的是一篇论文的项目,然后我共享桌面开始吟唱,讲了三分之二被打断了,说不让我讲了,感觉面试官赶时间😭 4.问我cha