Timeline: 9.15 投递 9.25 一面 9.25 一面 53min: 1.常见数据结构 2.TCP三次握手 四次挥手 3.Java基本数据类型 包装类型 4.==和equal的区别 5.面向对象三大特性 6.Hashcode方法怎么用 7.String stringbuilder stringbuffer 区别 8.泛型 反射 集合 9.Arraylist和linkedlist异同 1
9.14一面 数仓维度建模 离线数仓和在线数仓的构建流程 MapReduce过程 三道编程题: java无重复字符的最长字串(我实习也撕这个) 行列转换(一行变为多行,用mysql,不会。。。) 窗口函数序号函数三个(简单) 问我有没有收到其他公司的offer 将近1h,居然过了,我以为我挂了 9.21二面 这个面试官感觉说话慢悠悠的,然后不怎么问问题,我觉得是KPI来着 项目经历 实习经历 数仓
1,自我介绍。 2,两端实习经历详细讲讲。 3,事务的隔离级别。 4,sql中文乱码,怎么解决,更改编码的命令。 5,sql中日志相关。 6,查询内外连接,查询优化。 7,反问。 8,是否接受调剂?是否了解银行和子公司?
一面 1.自我介绍 2.介绍下实习的内容 3.介绍一个项目:深挖,包括技术栈、背景、目的 4.spark的内容怎么学习的 5.数据倾斜遇到过吗?怎么处理?产生原因? 6.t检验与z检验的区别? 二面 很快约二面后 因为面试撞了往后调(!!最好不要随意换时间) 1.自我介绍 2.从背景、个人责任、成果三个部分介绍一个项目 3.统计学知识 4.常用的机器学习方法?怎么学习的? 5.实习情况,有无转正.
# 一面9.8 自我介绍 离线项目用到什么架构 实习使用的是什么开发语言 实习做的是哪一层的开发 阿里数仓分层是怎么做的 Mysql的索引是用的什么 为什么用B+树索引 一条语句select from where group by having在mysql中执行顺序是什么 mapreduce的执行过程 hive分区表和分桶表的区别 数据倾斜有哪些是怎么处理的 给题说思路 1. 统计主键出现次数 2
40min左右 1.自我介绍 2.关系型数据库与非关系型数据库的区别,并举例 3.介绍hadoop 4.hadoop与hdfs的关系 5.spark的RDD的几个特点 6.RDD相对于mapreduce的优点缺点 7.hive join的几个方式,说明其原理 8.使用python是否做过大项目 9.为什么rdd处理速度比mp快,为什么mp没有被淘汰依然在使用。 10.提问项目 11.排序有哪些算法
友善的小哥 一小时 牛客 更新:已被挂。纯纯KPI 面走流程。面试问题基本全都答上来了,和面试官聊的也很好。面试一周后联系内推的朋友问了下已经被挂掉了。无语😅😅😅😅😅,move on了 暖场: 面试官自我介绍:美团优选风控部门 自我介绍一下吧 为什么选择数据开发这个方向? 以后的职业规划是什么样子的? 问项目: 介绍下你做的好的一个项目。按照项目背景,实现方式,以及最后的结果来介绍。
岗位:数据开发 体验还不错,面试过程偏向聊天,会问一些新技术,从基础的框架为起点延申出一些问题,面试官也很友好,有些问题答不上来也说没关系 问的相对基础,但但范围较广 (忘记录屏以下为回忆,面试时长1h [蔚来数开一面] 自我介绍 实习介绍(因为前一份实习和数开相关性不是很大,只是写过sql就简单带过了没深挖 kafka相关: kafka的结构 优点,和其他消息队列相比优势在哪 数仓项目(自己做的
绿盟科技一面(22min) 一、自我介绍 二、项目拷打(12min) 三、八股文 1.用过的树,在哪用过,说一下红黑树 2.希尔排序介绍 3.gdb调试,core dump文件 4.TCP,UDP,TCP拥塞算法 5.https加密过程 四、反问
1.怎么理解封装,有哪些关键字 2.多线程:线程池参数和执行过程、ThreadLocal场景和原理、callable和runnable区别 3.Object类:sleep和wait区别、hashcode方法为啥要重写 4.容器:为啥要重写hashcode、ConcurrentHashMap读写控制 5.ClassNotFound、类加载原理 6.项目,为什么要这样实现 7.杭州城市评价
绿盟科技二面(32min) 一、自我介绍 二、怎么自学的C++,看过什么书,学校位置,专业 三、项目拷打(15min) 四、八股文 1.gcc与g++相关参数 2.gdb指令 3.进程和线程 4.虚拟内存 5.内存分布,局部变量、全局变量、静态变量存储在哪 6.网络模型 7.TCP、UDP、ICMP 8.主机Aping主机B发生的事情 9.linux命令行,bash脚本 10.平时linux用的多
ORC 和 Parquet 文件格式的优劣势和区别? ORC(Optimized Row Columnar)和Parquet都是列式存储格式,它们在大数据处理领域,特别是在Hadoop和Spark生态系统中,被广泛使用。以下是ORC和Parquet的主要优劣势及其之间的区别: 设计背景: ORC:主要为Hadoop生态系统中的Hive而设计。 Parquet:是由Apache Arrow项目的一部
2024.1.9 面试 Boss直聘沟通 公司要求驻场开发,接受加班,接受出差 你是25届是吧?能在六个月左右是吗?目前在校吗? 后续有什么规划? 你怎么理解数据开发这个岗位的? 讲讲简历上这两个项目?是你在学校做的是吧? 项目你是全程参与是吧? 聊天这个项目的数据源是哪里来的呀? 项目整体是落在HDFS上是吧? 单一架构,嗷,然后可视化,是哇? 下一个电商项目介绍一下? 数据来源讲讲? 那意思是
昨天面的,三个面试官。 开始就是自我介绍。 1、第一个面试官问了问我一个数学建模的题目。我自己提了一嘴lstm,问了一下三个门 2、问了个sql题目,id不一样,邮箱有重复,怎么选出来,说用pandas也可以,问我pandas,不过我确实不常用pandas就没答出来 3、场景题,有通讯时间、地点、上网记录,如何判断哪些人是学生。 第二个问我懂不懂kafka、Hbase这些,我说不懂,就结束了。 感
9.19一面,大概20min左右 先共享简历、做个自我介绍 问实习经历 说说软件测试的大概流程 tcp/udp区别 Linux有哪几种系统,说几个Linux指令 http和https区别 数据库索引有什么作用(优点+缺点,我只说了优点,缺点面试官给我补充的) 给文件附777权限用什么指令 如果发现你要查询的网站断开连接了你会怎么排查 微信朋友圈设计测试用例 经典反问 剩下的不太记得了,问了很多,基