2022/08/13 一面 时长15min 感觉啥也没问 自我介绍 项目主要是大数据相关,你对算法方面了解多少 实习在做什么 想做偏算法还是偏数据的工作 如果其他部门提的取数需求做不了 你会怎么做 面试官介绍他们的电池时序数据 反问:业务部门多少人,入职后做的工作偏算法还是数据 ------------------------------------------- 2022/08/13 面试刚结
整理了一下提前批的面试 项目: 项目介绍一下 数仓建模,设计的每一层的作用?数据量有多大? Hive怎么创建分区表?项目有用到动态分区吗?用到过二级分区吗? 了解Hive调优吗?分区裁剪了解吗? HDFS写数据流程 一台DataNode宕机怎么处理 HQL语句的执行过程,验证用户权限在哪个组件?语法检查、表结构是否存在的检查在哪个组件? 对哪个大数据组件熟悉? HBase LSM树的思想说一下 M
一面 30min 两个面试官 一个问技术 一个问综合 自我介绍 比赛经历 比赛中Mapreduce写了哪几部分代码 实习项目说一下 实习任务分工 Kafka生产者消费者说一下 有什么主要的参数 一个SQL题目,要求根据经度纬度输出地点 场景题写一个spark代码 反问 ------------------- 2022/09/22 电话沟通意向 已拒绝 工作地点在宁波 #吉利控股##我的秋招记录#
一面 30min 自我介绍 项目经历 实习项目介绍一下 具体任务调度用的什么 ETL任务血缘怎么设置 实习公司数仓主题怎么划分 你所在部门构成 多少人 阿里云框架各部分负责什么功能 大数据国赛各部分做什么任务 Map Reduce过程介绍一下 count distinct的Map Reduce过程说一下 有几个map和reduce 实现count distinct功能你会怎么考虑优化 一道SQL
1、实习的工作内容是什么? 2、有写过UDF吗?如何实现UDF? 3、UDF要成为永久函数怎么做?如果不加temperory,函数下次还能用吗? 4、UDTF了解吗? 5、Hive的窗口函数有了解过吗? 6、开窗函数Over()中有没有orderby有什么区别? 7、汇总数据开发是怎么做的?(实习工作) 8、Flink任务的并行度和内存怎么设置的? 9、Flink的TaskManager内存模型了
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习 1.自我介绍 2.八股文 你写的这个实时数仓,维表是怎么更新的 flink了解吧,flink里面断流怎么处理 flink的exactly-once是怎么实现的 checkpoint的时候barrier什么时候发送 checkpoint产生了很多快照,怎么进行处理呢 sparkstreaming和str
问题描述: 有一张tmp表,字段分别是 开始时间start_date,结束时间end_date,欠费金额amount 输出描述:用户每天需要还的金额 分析:根据题目描述的输入输出,很容易知道思路哈,就是想要把从开始时间到结束时间的每一条数据都拆开存储,然后根据日期去聚合就可以得到每天的欠费金额了,所以难点就在于如何根据一个起始时间来进行拆分呢? 一行转多行,让我们可以想到的就是使用炸裂函数expl
#牛客解忧铺##牛客在线求职答疑中心##你觉得今年春招回暖了吗##面经##大数据开发# 附加信息:211本+985硕(非计算机),笔试4出头的分数,面了90分钟,面试官人超好,奈何本人过菜 1、部门介绍 2、自我介绍 3、项目介绍,在项目中承担什么角色,如何完成工作 大数据相关: 4、对大数据开发的理解 5、知道什么常用的大数据开发组件 6、谈谈MapReduce的原理 7、谈谈shuffle的实
大约45min 自我介绍 项目介绍 编程题: 顺时针打印矩阵(实际上变成了按顺序打印矩阵) 一个数的二进制有几个0 SQL: 每个学生合格了的成绩的平均分(HAVING) 总成绩第三名的学生 SHELL: 数一个文件出现了几个"beijing" 智力题: 3l和5l的杯子,量出4l水 操作系统: 死锁是什么、怎么解决 计网: 浏览器访问一个网站,有哪些过程 数据结构: 了解哪些数据结构 hashm
问了好多好多问题,很多没答好,但是面试官人很好,不会的也引导我, - 自我介绍 **项目** - **身份认证(再仔细看看session和cookie),** - **很多个**cookie,分布式的机器上。怎么办?消息队列? **操作系统** - 进程调度算法 - 时间片轮转算法没有答出!!!面试官还引导qq与微信同时运行,唉 - 虚拟内存与物理内存 - 用虚拟内存为什么快 **计算机网络**
1、 项目一直挖 2、 Spark调优 3、 Shuffle之类的优化 4、 平常写SQL注重优化之类的问题 5、 第一道题让看下面Java代码写输出。 private static void test(int[] arr) { for (int i = 0; i < arr.length; i++) { try { if (arr[i] % 2
1. 自我介绍 2. 要不要读博 3. 上一段实习经历中最困难的是啥/最不舒服的是啥/怎么解决得困难 4. 有女朋友吗?在哪里 5. 家在哪里?未来想在哪里工作?父母什么看法。 6. 投阿里没有,为什么不去阿里(感觉答得稀烂|我说投了被拒了) 7. 目前在进行中的应聘有哪几家,会选择去哪家 8. 啥时候能来实习?实习到啥时候 反问: 包住宿吗? 多久出结果?我有啥可以提高的
1. 自我介绍(问的项目的场景是干嘛的,解释 GStreamer)——20min 2. std::bind、原子变量、std::packaged_task、std::move ——10min 3. 100万亿找 top100、二叉树层序遍历 ——10min 4. 算法:手写线程池、无限背包 ps: 表示面试官人很好,还给我的垃圾找了理由。体验很好,下次还来
1. 自我介绍(问的项目的场景是干嘛的)——20min 2. 算法题(二叉树自底向上层序遍历(A了)、数组中找到重复的数(要求不用额外空间、O(N)的复杂度)(不符合要求,不会)) —— 30min 3. C++程序崩了怎么查(gdb、手动注释) 4. CPU 满了怎么定位线程(gdb、perf、火焰图) 5. C++八股(static啥用处) 6. 啥时候能来(下个月中旬) 7. 反问(我来了能
一上来让我先自我介绍。然后 问我学的最好的几门课, 我说了数据结构,java,//// 他问我数据结构怎么分类, 我说之前没想过,现在先想分为数组、堆,栈,队列、树,图。 然后问我链表是不是。我说漏了 。 又问我为什么链表不分进树里面。链表是单岔树 我说非得这么分就得把树分进图里面。 他说对啊,看你怎么分,重新组织下。 我说想不出来 问我java的jvm的理解。 我说有jvm能在各个系统上运行ja