了解哪些大数据组件 Shuffle 的作用是什么 Shuffle 中合并的操作有什么用/好处 MapReduce 中出现数据倾斜怎么处理 Yarn 有哪几个比较重要的进程 ResourceManager 主要的作用 ApplicationMaster 主要的作用 任务的监控在哪个进程 ZooKeeper leader选举机制 ZooKeeper 读写一致性具体体现在哪些地方 Spark 宽窄依赖
🍆 数仓方向 9.19 一面 第二天就挂了 自我介绍,科研项目介绍(项目相关问题提问) 1) 内部表和外部表的区别? 2) 窗口函数? 3) 知不知道比HDFS活跃度更高的产品? 4) Zookeeper常用得场景和用法?RATF协议了解吗? 5) CAP原理?一致性的概念? 6) Hadoop如何保证一致性? 7) Hadoop生态圈和MySQL等分布式数据库的区别? 8) Hive支
9.21 自我据介绍(面试官说简历上都是python项目,笔试用c++做的,就问c++。。。) c++容器有哪些?序列容器?关联容器? 函数重载?重写?重定义? 虚函数什么情况下使用?内存有什么不同?虚表大小? 手撕题(链表) 计网问题: 三次握手 粘包?怎么解决?因为开启了什么算法? 怎么排查网络问题? 反问的时候说今年没有专门数据研发岗,是进去之后再分配岗位,后端开发可能要转java 攒人品,
一面: 1.自我介绍, 2.询问了实习中的项目具体内容,提出了一个场景,问如何保证准确率 3.sql的执行顺序 4.数据库的索引类型 5.sql题 一道非常简单 还有一道要用到窗口函数 求连续三天登录 6.还有其他问题 有点记不清了 一面结束之后大概是隔天就收到了二面消息 二面: 1.自我介绍 2.问实习期间的项目 问了好几个小问题 3.问之前学习过程遇到的困难 怎么处理的 4.问MySQL和Or
9.22 一面 1h 自我感觉挺好的还,9.26挂了 1)自我介绍 2)两个项目介绍 3)Hadoop的元数据存在哪里? 4)什么是缓慢变化维?拉链表的数据具体是怎么更新?并举例 5)Kafka的零拷贝机制? 6)对RDD的了解 7)哪些情况下会发生索引失效? 手撕代码 1)无重复字符的最长子串 双指针+map 2) 求出数组中最小的n个数 3) 求出每个部门的薪资前三的用
面试岗位:数据库工程师 两个面试官,一个主要问知识点,另一个主要问实习、项目 介绍一下HDFS的写流程 Spark、Flink有哪些部署模式? Standlone和Yarn(Client、Cluster),会话模式、单作业模式、应用模式 有没有写过Flink平台的开发代码? Yarn由哪些角色组成?各自的任务是什么? Yarn的调度器有哪些? Hive和HBase的区别是什么? 项目中Kafka的
笔试时间 90min 20道选择题 + 3道编程题 主要还是考数据库的操作 如何增删查改 如何检索 然后阅读数据库代码 找错误/模拟运行 只有一道算法题 是AcWing_3578题 的变式 个人感觉算是降低难度 每次操作选取两个数 ai 与 aj, 并赋值ai = ai + aj, 删除aj; 中位数计算方式为为(m+1)/2向下取整。 输入第一行数据组数t 此后每组 第一行数组长度n 操作k数
因为来学校宣讲,直接打电话让去面试,笔试也没参加;听完宣讲会后直接面试,因为宣讲会开得比较久,怕太晚结束不了,每次面三个,所有的科技岗都是一个面试官,这个面试官经历挺丰富的,我这组数分和研发的他都能问不少问题; 首先是三个人每个轮着自我介绍,接着就主要问简历,没啥技术问题,我是主要问了我项目,数学建模建的啥,具体是干啥的,遇到了什么问题,收货有什么;然后问为什么选择银行;每个人都是差不多10分钟,
9.8 一面(30min) 介绍下自己的项目,项目的内容和使用的技术栈 细挖离线数仓项目 mysql三范式 hive内部表和外部表 hive数据倾斜 一道sql题 9.11 二面(30min) 两张亿级大表join有什么优化方案 场景题:公司通过银行给员工发工资,银行要完成公司账户的扣款和员工账户的收款,这个场景要如何设计,要考虑哪些问题? 介绍下离线数仓项目,几个人完成,多久完成,有哪些难点,现
面试结束,感觉就是面试五分钟,等候半小时 自我介绍一分钟,没说完被打断了 1、什么时候能来实习 2、实习薪资一天70,不解决吃住能否接受 3、是否为本地人,家在哪里 4、看我是学生干部,主要问了管理方面的问题 一点技术问题都没有,项目也没问 感觉好像是面试营业网点实习生,于是我回去翻出了四川省分行的通知,明确标明是分行本部的金融科技岗,面试问题也相对专业。 但是山东省分行也没有说是具体哪个单位,也
本文向大家介绍JS实现table表格数据排序功能(可支持动态数据+分页效果),包括了JS实现table表格数据排序功能(可支持动态数据+分页效果)的使用技巧和注意事项,需要的朋友参考一下 asp.net会经常遇到分页的效果,尤其是希望实现静态的html分页排序(html分页相信大家都已经有自己的解决方案.在这里就不多说).我写了一个简单的Demo排序. 数据就是字母和数字两组.(汉字需要找到asc
本文向大家介绍PHP函数实现分页含文本分页和数字分页,包括了PHP函数实现分页含文本分页和数字分页的使用技巧和注意事项,需要的朋友参考一下 最近,在项目中要用到分页。分页功能是经常使用的一个功能,所以,对其以函数形式进行了封装。 参数解释: $pageTotal是总页数,$page是当前页,$total是从数据库中获取的数据总数; 为了简化,将参数全部封装 参数解释: $pagestart是当页从
我正在一个聊天应用程序,其中消息存储在firebase实时数据库。现在,如果我创建一个如下所示的节点(Chats-Better-A-ID和-B-ID是自动生成的聊天室密钥),那么我想知道当用户S在聊天应用程序中打开与用户T聊天时,so数据库将只读取存储在Chats-Better-S-T-ID中的消息,而不会读取其他聊天室消息!?我说的对吗?如果是,那么它会降低定价吗? 或 如果我存储如下所示的数据
下载url来自一个单独的图像选择方法,顺便说一句。我的用户创建代码是这样的。