二面被面试官吊锤。问到了不熟悉的平时没太注意的细节。比如,utf-8能不能存emoj。当时有点忘记是utf-8的一个变种能存了,说了utf-8能存。百度基本问算法,算法设计这些,八股(指计网,操作系统等),大数据框架基本没问。项目也问的少。
整理了一下提前批的面试 项目: 项目介绍一下 数仓建模,设计的每一层的作用?数据量有多大? Hive怎么创建分区表?项目有用到动态分区吗?用到过二级分区吗? 了解Hive调优吗?分区裁剪了解吗? HDFS写数据流程 一台DataNode宕机怎么处理 HQL语句的执行过程,验证用户权限在哪个组件?语法检查、表结构是否存在的检查在哪个组件? 对哪个大数据组件熟悉? HBase LSM树的思想说一下 M
1、实习的工作内容是什么? 2、有写过UDF吗?如何实现UDF? 3、UDF要成为永久函数怎么做?如果不加temperory,函数下次还能用吗? 4、UDTF了解吗? 5、Hive的窗口函数有了解过吗? 6、开窗函数Over()中有没有orderby有什么区别? 7、汇总数据开发是怎么做的?(实习工作) 8、Flink任务的并行度和内存怎么设置的? 9、Flink的TaskManager内存模型了
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习 1.自我介绍 2.八股文 你写的这个实时数仓,维表是怎么更新的 flink了解吧,flink里面断流怎么处理 flink的exactly-once是怎么实现的 checkpoint的时候barrier什么时候发送 checkpoint产生了很多快照,怎么进行处理呢 sparkstreaming和str
#牛客解忧铺##牛客在线求职答疑中心##你觉得今年春招回暖了吗##面经##大数据开发# 附加信息:211本+985硕(非计算机),笔试4出头的分数,面了90分钟,面试官人超好,奈何本人过菜 1、部门介绍 2、自我介绍 3、项目介绍,在项目中承担什么角色,如何完成工作 大数据相关: 4、对大数据开发的理解 5、知道什么常用的大数据开发组件 6、谈谈MapReduce的原理 7、谈谈shuffle的实
1. 自我介绍 2. 要不要读博 3. 上一段实习经历中最困难的是啥/最不舒服的是啥/怎么解决得困难 4. 有女朋友吗?在哪里 5. 家在哪里?未来想在哪里工作?父母什么看法。 6. 投阿里没有,为什么不去阿里(感觉答得稀烂|我说投了被拒了) 7. 目前在进行中的应聘有哪几家,会选择去哪家 8. 啥时候能来实习?实习到啥时候 反问: 包住宿吗? 多久出结果?我有啥可以提高的
1. 自我介绍(问的项目的场景是干嘛的,解释 GStreamer)——20min 2. std::bind、原子变量、std::packaged_task、std::move ——10min 3. 100万亿找 top100、二叉树层序遍历 ——10min 4. 算法:手写线程池、无限背包 ps: 表示面试官人很好,还给我的垃圾找了理由。体验很好,下次还来
1. 自我介绍(问的项目的场景是干嘛的)——20min 2. 算法题(二叉树自底向上层序遍历(A了)、数组中找到重复的数(要求不用额外空间、O(N)的复杂度)(不符合要求,不会)) —— 30min 3. C++程序崩了怎么查(gdb、手动注释) 4. CPU 满了怎么定位线程(gdb、perf、火焰图) 5. C++八股(static啥用处) 6. 啥时候能来(下个月中旬) 7. 反问(我来了能
13:00时间,一个人大概8分钟,进去的时候我面带微笑,面试官问我怎么这么开心,接下来自我介绍,问我偏算法还是开发,介绍一下自己的项目,在做项目过程中有没有遇到什么困难,项目是虚拟的还是已经上线?接不接受转营销岗(说我更适合做营销,东城区或者通州区倾向哪),感觉技术已经无了,还是要好好挖项目
7.17一面 出自 自我介绍 项目的技术难点 redis怎么在项目里面用的 实习经历里面所学所悟 线程池用过吗,了解多少,为什么要使用线程池 用过什么Java的集合结构,我说的HashMap TCP UDP的区别和应用场景,以及三次握手 拥塞控制和流量控制 DNS 算法题:删除链表的倒数第n个节点 用过哪些数据库,索引-B+树 反问环节 【2024校招投递地址】 点我,投递的同学,在下方回复:名字
1、flume架构组成以及作用 2、flume到kafka中,如何保证同一个组件的数据放在kafka同一个分区里面 3、kafka支持全局有序吗?kafka isr?介绍kafka副本与hdfs副本区别 4、zookeeper在项目中的作用?如何判断节点是否存活? 5、HDFS什么功能用到了zookeeper? 6、spark的执行流程,比如做一个wordcount 7、sparkcontext内
8.29一面 一面一个小时,深挖项目,问了很多hdfs和一些操作系统底层原理,hdfs读写流程+心跳机制+副本机制+HDFS纠删码,手撕lc第15题改编题,撕出来了 关于虚拟化有一个印象深刻的问题,当前资源数为7,有4个用户,每个用户需要资源数为2,如何在当前时间段为这4个用户创建虚拟机,满足每个人的需求?我答时间片,面试官说也是一种思路,不过她想让我下去看一下超配。 八股: 什么是tcp四次挥手
自我介绍 问项目 容器迭代器失效问题 智能指针 share_from_this(寄,没听过) C++的锁 算法题:力扣56 学校成绩 在学校做过什么有成就感的事情吗 反问: 部门:做搜索引擎,基本全是用C++ 几面:3-4#得物面经#
1. hadoop如何实习高可用 2. 实习的需求(异步io) 3. 进程和线程的区别,通信方式有何不同,在开发过程中,需要注意的地方? 4. 物理地址空间和逻辑地址空间 5. 两道算法题,一道二分,另一道是改进之后的二分
1.自我介绍 2.项目 3.实习优化工作 4.强化学习原理 5.sql和java/python的区别 6.写题 统计每个年级,最高分数学生 7.numpy\pandas有没有一种可变机制的修改(没听过,真没听过) 8.对于RDD不可变的理解 9.对谓词和谓词下推的理解