了解哪些大数据组件 Shuffle 的作用是什么 Shuffle 中合并的操作有什么用/好处 MapReduce 中出现数据倾斜怎么处理 Yarn 有哪几个比较重要的进程 ResourceManager 主要的作用 ApplicationMaster 主要的作用 任务的监控在哪个进程 ZooKeeper leader选举机制 ZooKeeper 读写一致性具体体现在哪些地方 Spark 宽窄依赖
🍆 数仓方向 9.19 一面 第二天就挂了 自我介绍,科研项目介绍(项目相关问题提问) 1) 内部表和外部表的区别? 2) 窗口函数? 3) 知不知道比HDFS活跃度更高的产品? 4) Zookeeper常用得场景和用法?RATF协议了解吗? 5) CAP原理?一致性的概念? 6) Hadoop如何保证一致性? 7) Hadoop生态圈和MySQL等分布式数据库的区别? 8) Hive支
9.21 自我据介绍(面试官说简历上都是python项目,笔试用c++做的,就问c++。。。) c++容器有哪些?序列容器?关联容器? 函数重载?重写?重定义? 虚函数什么情况下使用?内存有什么不同?虚表大小? 手撕题(链表) 计网问题: 三次握手 粘包?怎么解决?因为开启了什么算法? 怎么排查网络问题? 反问的时候说今年没有专门数据研发岗,是进去之后再分配岗位,后端开发可能要转java 攒人品,
一面: 1.自我介绍, 2.询问了实习中的项目具体内容,提出了一个场景,问如何保证准确率 3.sql的执行顺序 4.数据库的索引类型 5.sql题 一道非常简单 还有一道要用到窗口函数 求连续三天登录 6.还有其他问题 有点记不清了 一面结束之后大概是隔天就收到了二面消息 二面: 1.自我介绍 2.问实习期间的项目 问了好几个小问题 3.问之前学习过程遇到的困难 怎么处理的 4.问MySQL和Or
9.22 一面 1h 自我感觉挺好的还,9.26挂了 1)自我介绍 2)两个项目介绍 3)Hadoop的元数据存在哪里? 4)什么是缓慢变化维?拉链表的数据具体是怎么更新?并举例 5)Kafka的零拷贝机制? 6)对RDD的了解 7)哪些情况下会发生索引失效? 手撕代码 1)无重复字符的最长子串 双指针+map 2) 求出数组中最小的n个数 3) 求出每个部门的薪资前三的用
面试岗位:数据库工程师 两个面试官,一个主要问知识点,另一个主要问实习、项目 介绍一下HDFS的写流程 Spark、Flink有哪些部署模式? Standlone和Yarn(Client、Cluster),会话模式、单作业模式、应用模式 有没有写过Flink平台的开发代码? Yarn由哪些角色组成?各自的任务是什么? Yarn的调度器有哪些? Hive和HBase的区别是什么? 项目中Kafka的
笔试时间 90min 20道选择题 + 3道编程题 主要还是考数据库的操作 如何增删查改 如何检索 然后阅读数据库代码 找错误/模拟运行 只有一道算法题 是AcWing_3578题 的变式 个人感觉算是降低难度 每次操作选取两个数 ai 与 aj, 并赋值ai = ai + aj, 删除aj; 中位数计算方式为为(m+1)/2向下取整。 输入第一行数据组数t 此后每组 第一行数组长度n 操作k数
因为来学校宣讲,直接打电话让去面试,笔试也没参加;听完宣讲会后直接面试,因为宣讲会开得比较久,怕太晚结束不了,每次面三个,所有的科技岗都是一个面试官,这个面试官经历挺丰富的,我这组数分和研发的他都能问不少问题; 首先是三个人每个轮着自我介绍,接着就主要问简历,没啥技术问题,我是主要问了我项目,数学建模建的啥,具体是干啥的,遇到了什么问题,收货有什么;然后问为什么选择银行;每个人都是差不多10分钟,
9.8 一面(30min) 介绍下自己的项目,项目的内容和使用的技术栈 细挖离线数仓项目 mysql三范式 hive内部表和外部表 hive数据倾斜 一道sql题 9.11 二面(30min) 两张亿级大表join有什么优化方案 场景题:公司通过银行给员工发工资,银行要完成公司账户的扣款和员工账户的收款,这个场景要如何设计,要考虑哪些问题? 介绍下离线数仓项目,几个人完成,多久完成,有哪些难点,现
🕒岗位/面试时间 1小时30分钟 1、自我介绍 2、讲一下kaggle金 方案,围绕着一个比赛扣细节 3、围绕天池/miccai workshop比赛展开 3、Gem代替global avg pool动机,Gem公式,代码实现 4、BN公式、其中可学习参数的意义 5、手撕Focal Loss 6、手撕Crop(提供一个中心点,和裁剪的宽高,要防止越界等异常情况) 7、反问 已发下一面时间
判断一个树是否是另一个树的子树,本来是直接判断指向的是否是同一个节点,后说值相同也可以,就改了下#实习##面试##24实习#
问题内容: 我有2个月的2个数据集,包括学生的姓名和分数。 我需要提供每个学生的2月分数,以及他/她2月分数的变化百分比。 我可以使用Java集合吗? 样本数据集: 输出应该是这样的 (名称:约翰,2月分数:80,百分比变化:100) (名称:玛丽,2月的分数:81,百分比变化:32.76) (名称:吉姆,2月的分数:82,百分比变化:57.69) (名称:利兹,2月的分数:84 ,百分比变化:N
蓝湖提供的样式 设置之后展现,感觉要比设计稿粗很多,需要用设计稿的样式?
PS:前几天慌的一批,我在小红书看到了一个接到实习电话的女生,我从14号开始,每隔几天打一次电话给人力,打了差不多五六次,果然我的被动是当我绝望时突然给我希望。#广东广电网络# 总算有个保底了,进可攻退可守,再过一段时间事考就开始了,要是考上编制,狠狠躺平 顺便更新以下星辉游戏数据分析岗笔试:考试时间50分钟,是问卷星的形式考的,主要分为三个部分,首先是介绍自己的游戏经历让你评价一下你玩的这款游戏
本文向大家介绍Python中列表、字典、元组、集合数据结构整理,包括了Python中列表、字典、元组、集合数据结构整理的使用技巧和注意事项,需要的朋友参考一下 本文详细归纳整理了Python中列表、字典、元组、集合数据结构。分享给大家供大家参考。具体分析如下: 列表: 字典: 集合: 元组: 1.列表 空列表:a=[] 函数方法: 删除元素的方法: 列表推导式: 嵌套列表推导式: 思考:list