一面 实习做什么 介绍实习的项目 对大数据的开发 数据仓库的认识 为什么数据仓库分层 Spark SQL题 分组TOPN 算法题 二面 介绍实习 Spark底层 Stage怎么划分 宽窄依赖 口述SQL语句转Spark RDD 代码算法题 SQL题 留存率 三面 介绍实习 介绍这个学校的项目(开始问算法。。) 用的哪些算法 为啥这样用 概率论相关 三门问题 三门问题进阶 扔硬币,先扔的人胜率 面了
自我介绍 new String() == "" new Integer(100) == 100 说一说集合List和Map java中的锁 写一个双重锁单例模式 mysql 几种锁,怎么设计一个联合索引 多线程的实现方式,区别 SpringBoot 用过哪些注解,怎么定义一个接口 手撕单链表排序(写过但是忘干净了,寄) 总结:偏后端,寄就寄吧#数据开发##数据开发工程师面经##好未来面经#
13:00时间,一个人大概8分钟,进去的时候我面带微笑,面试官问我怎么这么开心,接下来自我介绍,问我偏算法还是开发,介绍一下自己的项目,在做项目过程中有没有遇到什么困难,项目是虚拟的还是已经上线?接不接受转营销岗(说我更适合做营销,东城区或者通州区倾向哪),感觉技术已经无了,还是要好好挖项目
1. hadoop如何实习高可用 2. 实习的需求(异步io) 3. 进程和线程的区别,通信方式有何不同,在开发过程中,需要注意的地方? 4. 物理地址空间和逻辑地址空间 5. 两道算法题,一道二分,另一道是改进之后的二分
1.自我介绍 2.项目 3.实习优化工作 4.强化学习原理 5.sql和java/python的区别 6.写题 统计每个年级,最高分数学生 7.numpy\pandas有没有一种可变机制的修改(没听过,真没听过) 8.对于RDD不可变的理解 9.对谓词和谓词下推的理解
思特奇一面 19min(已进终面)总体来说不难,但是网上风评不太好 1. 自我介绍 2. 介绍一下你在实习中用到最多,掌握最好的技术? 3. 介绍一下你项目中,从数据采集,到数据加工到标签生成,整个流程能介绍一下吗? 4. 标签用什么语言开发?能简单介绍一下hive吗?hive的分区?hive表能单条删数据吗? 5. 你能说一下hive sql的性能优化吗?参数+代码 6. 说一下你的比赛内容?你
24届秋招 一面电话面 自我介绍 介绍实习工作 数据倾斜怎么解决 map join 原理 维度缓慢变化了解吗 二面视频面 介绍实习 实习工作具体内容 口述SQL题 了解哪些数据治理 数据仓库迁移介绍下 过了几天HR面 OC
1.自我介绍 2.解释数据库,表,索引 3.索引一遍加在哪里 4.问索引为什么能加快查找速度 5.解释第三范式 6.出了七八道走不走索引的判断题,解释理由(有个范围查找的走没走索引答错了,呜呜呜呜) 7.解释二叉树 8.问二叉树的几种遍历方式 9.算法题,问二叉树存不存在根节点到叶子结点路径上的数据和为一个target。 反问,问了部门业务场景,还稍微聊了一点数仓的东西。 12.16update,
1、自我介绍(说完之后面试官沉默十秒) 2、介绍项目(介绍完项目之后,面试官沉默了半分钟),针对项目问了几个问题(每个问题之间各有十秒到几十秒不等的沉默) 3、简单介绍下hadoop和spark(答完之后面试官沉默了十几秒) 4、熟悉哪些主流数据库(答了mysql和SQL server)(答完之后面试官沉默了十几秒) 5、mysql有哪些引擎(答完之后面试官沉默了十几秒) 6、innodb的索引基
了解哪些大数据组件 Shuffle 的作用是什么 Shuffle 中合并的操作有什么用/好处 MapReduce 中出现数据倾斜怎么处理 Yarn 有哪几个比较重要的进程 ResourceManager 主要的作用 ApplicationMaster 主要的作用 任务的监控在哪个进程 ZooKeeper leader选举机制 ZooKeeper 读写一致性具体体现在哪些地方 Spark 宽窄依赖
1.分区表 2.Hive和Spark的区别 3.为什么要来数据开发,了解数据开发吗 4.维度建模 5.项目相关问题 6.对UDF、UDAF、UDTF三者的理解 7.数据格式Parquet、ORC、Avro 8.Parquet、ORC的区别 9.分层的作用 .......... 总的来说和面试官沟通的过程中也学到了很多,但是感觉通过希望不大,好多都没答上来
自我介绍 打开搜索框按下回车会发生什么? 根据这个问题把http,tcp,ip,mac,dns,arp,路由器,交换机,基本上把网络相关的问题都问了一遍。 https的目的,加密过程,ca证书 静态链接动态链接 写了个反转链表,需要自己定义节点,输入输出 问嵌入式相关。我一点都不懂,就没继续问了。 大端和小端,写个代码判断当前机器是大端还是小端。 反问 我以为做矿机只是跟硬件打交道,面试官说跟我写
#数据人的面试交流地# 1.首先自我介绍,一定要加上自己会啥,自己的优势一定要多说出来 2.简历上写的项目一定要自己做的,如果是网上抄的一定要弄懂才能写出来,要不然容易出现问题 3.写自己的技能一定要写自己弄的比较懂的 4.再来说一下我对大数据的理解,大数据讲究计算和存储,对于存储一定要懂hdfs,hive等等技术,对于计算我建议一定要会spark,flink也要会,你可以不用但要会,spark说
#软件开发2023笔面经# 个人感觉是根据简历内容来的,尤其是项目,简历涉及大数据,神经网络,数据库 数据库范式SQL和NoSQL 的区别,各自的优缺点 Hive 数据结构特点 Hive 导入数据有哪几种方法 Hive 和 Hbase 区别 Python 和 Java 区别,特点 说一下这个神经网络,搭建过程,激活函数为什么选这个 HBase数据结构特点,Hbase 的优缺点 说一下TextCNN
mapreduce中有哪些排序 yarn的事件驱动 hbase写热点问题 建表时怎么指定空region spark sql中dataframe怎么把表中的字段提取出来 hive怎么提取出来 yarn中的container怎么实现 写一个sql,学生不同学科的得分排名前三 手写单例模式,策略模式,工厂模式,并描述在什么场景下使用,口述一下装饰者模式 arraylist和linkedlist的区别,什