自我介绍 接下来就是问一堆奇怪的问题夹杂着八股 行式存储vs列式存储 MapReduce流程 Spark流程 Yarn流程 Kafka流程 维度建模 数仓分层 你写没写过MR源码? 你怎么看流批一体? sql 求视频累计观看数 答的一般 感觉凉了 #数据人的面试交流地#
刚面完,面试官挺和蔼的 开头自我介绍+项目+追问细节 看我还没做笔试,就没问算法相关的,说做完笔试再说 一道情景题,如何对网上言论的质量进行分级,尤其是一些专业领域内的言论 可能因为我是非科班本科生吧,就没考八股,亏我准备了那么久的hadoop 最后说笔试之后再约一次面试 反问
数仓理论,项目,问我从哪了解的数仓,我说项目学习和大数据之路,面试官笑了“谁推给你的这本书” 然后sql题 反问 实习生干什么~指标搭建,应用层简单建模,可视化 18分钟解决。。。 大厂的实习总是这么迷惑,小米按校招流程给我又是sql又是算法一顿鞭策,这个15分钟告诉我结束了,而且这位好像是负责我的业务导师。。
背景:985本硕,无实习,自学大数据相关技术栈,尚硅谷离线+实时数仓,实验室项目。 hdfs读写流程 mapreduce shuffle maptask和reducetask数目如何确定 小文件过多对namenode有什么影响 mr优化有哪些点 进程和线程 hive sql转换为mr的过程 离线数仓项目:项目流程,思考,价值 如何保证数据一致性 如何衡量两个数仓的优劣 两道题: 1-1000的递增
整体的面试内容会结合项目和实习经验进行提问,面试官人很好,问题也是由浅入深。 有监督学习和无监督学习的区别 过拟合的处理方法 梯度下降法原理 损失函数作用 实习的主要内容 ES中索引的类型和作用 ES的优点 mapreduce的原理 还问了一些数仓的知识 没答上来 数学建模 模型的类型(记得好像是这样 一道简单算法题 反问
CTO(现爱橙科技)- 外部数据 暑期实习 一面 自我介绍 实习做了哪些工作,介绍一下 在学校主要研究方向是什么,用的什么编程语言 python掌握得怎么样 juc 乐观锁,悲观锁 mysql哪些字段应该建索引 一张很大的表,如何优化查询效率 如果kafka数据丢失,可能是哪些原因 数据仓库分层讲一下 开放题:不限制条件,器材,方法,求解西湖的水有多少升?(一脸懵逼) 二面 自我介绍 数仓项目介绍
CTO-数据产品与技术部 暑期实习 一面 自我介绍 是保研的吗 实习做了哪些工作 为什么想做数据开发 研究生的方向 本科学过哪些计算机专业课 栈和队列的区别,应用场景 二叉树了解吗, 平衡二叉树了解吗 了解哪些排序算法, 分别说下原理和时间复杂度 快排的最差时间复杂度, 为什么,怎么优化 TCP三次握手, 为什么不是两次 MapReduce运行流程说一下 udf,udaf,udtf区别 spark
技术面: 1.简单介绍一下自己 2.讲一下你的三个项目:先讲了毕设,讲完笔试就开始问我,后面两个项目没有让我说了,毕设问题:你用什么编程语言写的,我回答毕设偏硬件,只有电脑端数据采集检测需要涉及一些编程,因为项目还在做,导师还没有安排PC端软件的编程,正准备跟导师进行后续沟通,补充一下,问到了在三个项目中负责的东西 3.对岗位的理解(做什么的,我回答是做一些产品性能测试,看产品质量是否达标等) 4
1、实习项目最记忆深刻的点?项目架构?导入的数据如果有些sql没有加入怎么办?【通过Transactional注解,然后回答了该注解的运行机制,应该答会回滚】 2、JVM运行机制,问JVM内存空间,一个java对象怎么运行的?字节码文件是什么?JVM是编译还是解释? 3、静态变量存储在哪里? 4、网络方面的:OSI七层?网络接入的时候七层和四层的区别?TCP和UDP的区别 5、抽象类和接口的区别?
岗位:软件开发工程师 专业一面:8/17 自我介绍 项目 简单八股 手撕代码:LeetCode中等题 专业二面:8.17 项目 手撕代码:字符串编码相关,个人认为是中等题 业务主管面:8/18 自我介绍 项目 聊经历,主要是简历上写的 聊天,对一些事情、对象、情绪的看法 反问 总结:专业面试比较简单,难度不高,主管面的面试官很和善,感觉到到了我的紧张 在一步步的引导我放松,所以后面就聊hi
base西安 1.自我介绍 2.Java集合 有哪些,都有什么特点 为什么jdk1.8后hashmap底层用红黑树 3.线程池 线程池参数 怎么创建 饱和策略 3.Mysql 引擎 隔离级别 索引 4.Spring IOC和AOP 用到哪些设计模式 5.项目 ElasticSearch相关问题(答的不好)
百度型子串 模拟,对所有子串按照题目题目要求遍历判断即可 01串 写出所有2、3、4长度的01串找规律: ‘1’的数量为偶数或‘0’的数量为偶数则Yes,否则No 走矩阵 DFS,每走下一步的时候注意判断是否满足题目要求(这题输入n,m后要吃一个换行再读,不然61%) #百度笔试#
百度笔试20220913 AK 第一题 给定一个字符串s,找出类似“baidu”的子串个数 类似“baidu”的子串是指: 子串的第一个和第四个字符为辅音 子串的其余字符为元音”aeiou” 不含重复字符 数据范围:len(s) < 2e6 Solution 由于给定了具体的位置,所以不好滑动窗口做 所以直接每五个字符check一下 第二题 给定一个t,表示接下来有t行数据 给定一个01字符串s,
一面(两个面试官) 自我介绍 项目介绍 问语言架构的问题(我是Django),一直问到不会 问python语言的基础知识,一直问到不会 问网络,一直问到不会 问redis,简单问了一下有哪些数据结构以及应用场景 另一个面试官(感觉像是hr)问竞赛,专利,论文等 全程35分钟左右,没有撕题 二面 线下面:base西安,感觉办公环境很好 自我介绍 项目介绍 问一些个人情况 问主语言(绿盟好像pytho
5.19 一面 5.22 2面 刚面完 不知道是不是kpi面 二面hr说一周内给结果 问他我表现的怎么样,他说他具体也不清楚,后面还有几个同学等他继续面试,感觉凉凉。。。。 一面: 自我介绍 介绍自己的两篇专利 机器学习有哪些(因本人论文用的深度强化学习) 大模型有了解吗 chatgpt理解,会根据你的理解展开问问题 python中 pyc这些有了解吗 c++中什么情况下会导致空指针异常,如何解决