字节面经 项目的数据来源和的数据的规模 Spark Shuffle spark的宽窄依赖 数据倾斜问题(★★★★★) 产生数据倾斜的原因 遇到过的数据倾斜的实际情况 数据倾斜的解决办法 介绍一下hadoop的NameNode NameNode高可用架构 NameNode主节点宕机,之后的选取机制 Zookeeper的选取机制 NameNode中的元数据是否会丢失?(★★★★★) 怎么保证元数据不丢
浪潮 数据分析岗 3位面试官 1位主持自我介绍,1位负责sql,1位负责Python 上来先自我介绍 sql问题:用过什么 数据 库?sql的查询顺序? 简历问题:项目组遇到问题怎么解决? Python问题:iloc和loc区别?merge和append区别? 都很简单 很快的几分钟面完 #面经# #校招# #提前批# #秋招#
#软件开发2023笔面经# 前段时间投了4399数据分析方向,本来是15号晚上七点的笔试,忘记参加了顺延到了16号上午九点,内容比想象的多,有十个选择题,涉及面很广,数据结构问时间复杂度的,操作系统问概念的,计算机网络ip结构也问了,java代码也考了,10个选择题,我感觉还有点难,然后有简答题三个,编程题三个,职场题两个,一共两个小时。 简答题有说出代码错误的,写sql语句的,SQL优化的,呜呜
一面 1、自我介绍 2、介绍一下实习 3、深挖上一段实习,尤其针对其中的数据问题,会从几个维度出发 4、数据来源,如何处理,使用什么工具,处理后如何探索,得到什么结论,结论正确性,结论价值。如果数据源复杂度增加,怎么处理,如何分析。 5、扩展了一个上段实习的具体问题,数据维度增加,复杂性增强,后续如何预测? 二面 1、自我介绍 2、介绍一下实习,问了一些细节,但没做扩展和深挖 3、在上一段实习
个人bg 24届老东西,本科偏自动化的AI,非计院 211本,保研到985,本科主要是以lab为主,硕士阶段的研究方向主要是存储。 leetcode 300题,个人很讨厌算法,而且是夏令营结束后再也没刷题了,算法退化成草履虫水平了。 项目 15-445 6.824 Ob数据库大赛,主要写了初赛的经历,提了一嘴决赛 其他:系统方向的,存储,数据库,分布式等看过不少paper,但是没正儿八经参加过科研
我正试图让我的头绕过DDD,但我卡住了。这就是我如何设置我的项目: 然后,我继续实现UserRepository,这里我遇到了另一个问题:UserRepository接口需要域用户模型,当我试图在DAL中实现接口时,我需要使用域用户模型来实现它,这导致DAO是为域模型而不是DAL模型创建的,这没有任何意义。唯一能修正的就是在域层中引用DAL,这是错误的。 有人能解释一下我在DDD中遗漏了什么吗?
问题内容: 我需要一些想法来实现Java的(真正)高性能内存数据库/存储机制。在存储20,000+个Java对象的范围内,每5秒钟左右更新一次。 我愿意接受的一些选择: 纯JDBC /数据库组合 JDO JPA / ORM /数据库组合 对象数据库 其他存储机制 我最好的选择是什么?你有什么经验? 编辑:我还需要能够查询这些对象 问题答案: 您可以尝试使用Prevayler之类的工具(基本上是一个
问题内容: 我上了一堂课,想跟踪学生的统计数据。我打算稍后制作一个GUI来处理这些数据。 我的主要问题是:保存和以后检索此数据的最佳方法是什么? 我已经读过关于pickle和JSON的文章,但是我并没有真正了解它们的工作方式(尤其是关于它们如何保存数据的信息,例如哪种格式和位置)。 问题答案: 对于持久性数据(存储有关学生的信息),数据库是一个不错的选择。如前所述,Python附带了Sqlite3
问题内容: 我试图使用s或函数读取稍大的数据集,但我一直遇到s。数据框的最大大小是多少?我的理解是,只要数据适合内存,数据帧就应该可以,这对我来说不是问题。还有什么可能导致内存错误? 就上下文而言,我试图在《2007年消费者金融调查》中阅读ASCII格式(使用)和Stata格式(使用)。该文件的dta大小约为200MB,而ASCII的大小约为1.2GB,在Stata中打开该文件将告诉我,对于22,
我一直在本地重新创建此示例:https://github.com/spring-projects/spring-integration-samples/tree/master/basic/sftp 但这次只使用注释而不是xml配置。我有这样的东西: SftpCommon类: SftpConfig类别: 在我的测试中,我有这样的东西: 我的stackTrace是: org.springframewo
我有用户表,列id, mname, firstname, lastname, age(5列)使用Spring data jpa我只需要获取id, firstname, age(只有3列) 实用性低于user.java UserRepository.java 在科尔索勒中收到以下错误: org.springframework.core.convert.ConverterNotFoundExcepti
时间是晚上7点到8点半 总共一个半小时 已知10个元素数据(54,28,16,34,73,62,95,60,26,43)依次插入节点的方法生成一颗二叉排序树,再查找成功的情况下,每个元素的平均比较次数为? 解 理解二叉树结构 总比较次数应该为 1+2+3+3+2+3+3+4+4+4=29 平均比较次数为2.9 给定一个无向图的节点编号结合为{A,B,C,D,E,F},边的结合为{A-C,A-D,B
面试主要问的和作品相关,强调作品的全局把握。只有一位面试官。 面试问题主要分为三个部分,个人以及作品介绍、作品提问和反问环节。 一、个人以及作品介绍 个人介绍一般所有面试都会有,除了简历中的个人基本信息之外,建议总结一下自己的作品,让面试官对于你的作品有基本的了解。注意这里一定要突出个人重点,同时注意好时间。 二、作品提问 一般情况只会询问一个项目,只需按照作品集的架构进行类似于PPT汇报的形式讲
二面的面试官是部门的小组长,这轮有点压力面。 面试问题主要和个人经历相关,强调个人在项目中的能力和思考,会根据回答来追问,主要的问题如下: 1、请简单介绍一下你的专业。 2、然后面试官就顺着我的回答,让我介绍在学校里面做的项目。 我从背景到设计过程再到设计方案做叙述。 3、然后面试官在讲述中间多次打断,不停的追问我在项目中起到的作用以及进行项目的策略是什么。 于是我就先总结我的策略:以业务目标为基
三面的面试官是部门主管。 面试问题和作品集相关,强调对于设计之外的细节的把控。提问和一面一样分为个人及作品介绍、作品提问以及反问。 一、个人及作品介绍 这里就不再过多的赘述了 二、作品讲述阶段 按照一面经验中的要点( 详略得当、分类以及分点)来讲述就没问题,我讲完之后,面试官还点评了一句说讲的非常清晰。 三、提问阶段 部门老大更多考虑项目的业务层面,问到的问题有: 1、项目的业务背景是什么? 2、