总体二十多分钟 1.先问了一下基础情况,然后做自我介绍 2.拷问实习项目,主要问我数据怎么做的、数据分布怎么调整,然后不知道怎么跳到文本分类的样本分布上了,问我文本分类样本不均衡怎么做;然后问我模型训练怎么做的,让我介绍一下deepspeed框架、vllm框架 3.拷问我rag的项目,问我两路召回中这两路有什么区别、rerank的作用、selfrag是什么、模型推理时延 4.拷问我的论文项目,主要
稍微难一点就败北了,伪大佬 1、5 6、7‘、10 6*2' InnoDB 存储引擎,事务提交commit依赖什么日志机制实现? D? which wrong A. 文件、进程可以作为shell命令的参数 B. 附带选项和参数,二者shell命令一次只能带一个 C. shell命令可省略参数 D. 命令选项后面可能带附带参数 B? 打印a.txt的最后10个字符 A. tail +10 a B.
2022.10.9 一面 共15分钟 1.自我介绍:大概两分钟 2.问答: a.实习经历-sql是如何优化的 答得不好,明明是准备好了的, 一是优化整体逻辑,二是语句优化,只答了第一点,一定要清楚面试官问问题的内在目的,不要回答那么表面。 b.实习经历-窗口函数,三个排序(row_number, rank, dense_rank)的区别,答得不好,明明也是知道的,就按准备好的说,不要现场发挥啊……
动不动就被打断!!!!!面试体验感太差了,好几次都想骂回去了 而且招什么数据开发,改成全干工程师好了 11.9 一面 1h zookeeper选举机制 zookeeper分布式锁? 手撕二分查找(递归、非递归:两个函数参数问的不一样,还得问我为什么用不一样的参数名,有啥区别.....) 对Yarn的理解?Yarn工作机制?(说到一半又被打断,让用程序来实现)手撕Mapreduce程序 Spark的
23.5.30快手一面 1、介绍项目 这里都根据个人项目去聊的,问了很久 2.数据怎么来的(ods层数据同步问题)ads层下游怎么做,数据怎么来的报表直接查的ads层吗 数据抓过来存在哪 3.hadoop了解吗hdfs有那些组件, 4.聊聊mapreduce进行几次排序 一个sql题,按分数进行排序 count(*) count(1) count(col)三者有什么区别 数据倾斜 pv值 23.5
整体的面试内容会结合项目和实习经验进行提问,面试官人很好,问题也是由浅入深。 有监督学习和无监督学习的区别 过拟合的处理方法 梯度下降法原理 损失函数作用 实习的主要内容 ES中索引的类型和作用 ES的优点 mapreduce的原理 还问了一些数仓的知识 没答上来 数学建模 模型的类型(记得好像是这样 一道简单算法题 反问
自我介绍 接下来就是问一堆奇怪的问题夹杂着八股 行式存储vs列式存储 MapReduce流程 Spark流程 Yarn流程 Kafka流程 维度建模 数仓分层 你写没写过MR源码? 你怎么看流批一体? sql 求视频累计观看数 答的一般 感觉凉了 #数据人的面试交流地#
刚面完,面试官挺和蔼的 开头自我介绍+项目+追问细节 看我还没做笔试,就没问算法相关的,说做完笔试再说 一道情景题,如何对网上言论的质量进行分级,尤其是一些专业领域内的言论 可能因为我是非科班本科生吧,就没考八股,亏我准备了那么久的hadoop 最后说笔试之后再约一次面试 反问
数仓理论,项目,问我从哪了解的数仓,我说项目学习和大数据之路,面试官笑了“谁推给你的这本书” 然后sql题 反问 实习生干什么~指标搭建,应用层简单建模,可视化 18分钟解决。。。 大厂的实习总是这么迷惑,小米按校招流程给我又是sql又是算法一顿鞭策,这个15分钟告诉我结束了,而且这位好像是负责我的业务导师。。
背景:985本硕,无实习,自学大数据相关技术栈,尚硅谷离线+实时数仓,实验室项目。 hdfs读写流程 mapreduce shuffle maptask和reducetask数目如何确定 小文件过多对namenode有什么影响 mr优化有哪些点 进程和线程 hive sql转换为mr的过程 离线数仓项目:项目流程,思考,价值 如何保证数据一致性 如何衡量两个数仓的优劣 两道题: 1-1000的递增
一面 实习深挖 实习中遇到什么难点 数仓如何分层,每层如何设计模型 发现凌晨任务挂了,讲快速排查思路 几种join方式的区别 如何优化使用row_number的效率 拉链表原理和作用 对etl的理解 cte的特点 sql每个部门薪资最高的员工,要求两种方法 算法构造二叉树 二叉树几种遍历方式实现 介绍栈和队列,以及各自的应用场景 还有些忘记了,都怪库克没做录音功能 二面 实习深挖 有过什么任务优化
公司:北京快手 面试时间:2024.07.04,共计55分钟 问题 自我介绍 Java中Map在内存中的存储结构,如何存储数据? HashMap的底层数据结构是什么? 介绍一下ArrayList? int a1[4096]; Integer a2[4096]; 两个数组求和哪个更快? 对连续内存的数据做计算,CPU会有哪些加速设计? Java中创建对象返回的引用地址和物理内存条中的地址有什么关系?
CTO(现爱橙科技)- 外部数据 暑期实习 一面 自我介绍 实习做了哪些工作,介绍一下 在学校主要研究方向是什么,用的什么编程语言 python掌握得怎么样 juc 乐观锁,悲观锁 mysql哪些字段应该建索引 一张很大的表,如何优化查询效率 如果kafka数据丢失,可能是哪些原因 数据仓库分层讲一下 开放题:不限制条件,器材,方法,求解西湖的水有多少升?(一脸懵逼) 二面 自我介绍 数仓项目介绍
CTO-数据产品与技术部 暑期实习 一面 自我介绍 是保研的吗 实习做了哪些工作 为什么想做数据开发 研究生的方向 本科学过哪些计算机专业课 栈和队列的区别,应用场景 二叉树了解吗, 平衡二叉树了解吗 了解哪些排序算法, 分别说下原理和时间复杂度 快排的最差时间复杂度, 为什么,怎么优化 TCP三次握手, 为什么不是两次 MapReduce运行流程说一下 udf,udaf,udtf区别 spark
#海尔面经# 海尔 物联网软件研发工程师 一面 没有笔试 说是直接面试 自我介绍 两个面试官 一个技术 一个HR小姐姐 介绍java项目 然后问技术 我做的是一个外卖项目 1.用户下单取消如何处理 背后的逻辑 2.微服务有没有用到 3.这个项目有没有上线 多少人用 第一个一脸懵逼 之前只是简单的看视频做项目 压根没考虑过这种问题 第2,3个还想狡辩一下 最后放弃了 然后 redis的数据