面的是团子的金融部门,挺感兴趣的,记录一下二面问题 1.说说你做的两个项目(一个离线数仓一个flink) 2.你挑一个详细说说吧(面试官笑,当时感觉有点不妙了,,,觉得面试官啥都能问,我说了flink) 3.说说watermark机制 4.说说checkpoint机制 5.说说exactly-once是怎么实现的 6.了解反压吗(了解) 7.你觉得hadoop和spark差别在哪 8.你对实时更感
自我介绍 介绍面试题:数据分析相关需求,使用AI辅助,提供提示词文本 对数据分析的理解 你做过的一个数据分析项目 得到了什么结果 预设场景怎么分析,设计提示词 用的AI工具 文本场景与数据分析场景AI使用的不同 北京实习问题 反问
去年四月份的暑期实习,现在来分享一下吧 一面: 自我介绍 怎么学的scala 介绍项目 数据来源 flume拦截器 sqoop参数 说一下hdfs zookeeper在项目中的作用 mysql锁机制 日志数据采集不到的情况 项目中的困难 azkaban调度了多少任务 presto在项目中怎么用的 介绍一下缓慢变化维和拉链表 一道sql题 读过什么书或者论坛 一面就是这些问题啦,有帮助的话点个赞噢
面试官:知道索引有什么类型吗? 面试官:B树索引说一下? 面试官:你刚刚说值都存储在叶子节点,那有什么好处? 面试官:知道为什么主流数据库引擎不采用哈希索引吗? 面试官:聚簇索引和二级索引有什么关联? 面试官:那我一条SQL,我怎么知道它有没使用到索引? 面试官:有没索引失效的情况呢? 👉以贴近现实的【面试官面试】形式帮助你系统学习后端技术 📚本期是《MySQL系列》,其他系列博客请订阅专栏《
模型开发的流程,需求调研过程中有哪些人员参加,调研过程,你会输出什么文档? 如何保障数据质量(准确性)? spark有什么优缺点?在使用过程如何规避缺点? spark内存模型? spark和MR为什么会进行shuffle,如何减少shuffle? 小文件治理的方式? 主题域建设的流程? 大表join大表的优化(10亿与1千万数据关联)? 为什么存在ods穿透? 为什么离职,旧公司工作强度如何? 这
🕒 岗位/笔试时间 4月15日 项目挨着梳理 ,一条一条问。 分库分表那里需要深挖。 布隆过滤器。 条件筛选。怎么搜索? ES不会,筛选是用的redis来做的 缓存更新策略问题 mq消息丢死问题 令牌桶 mysql最左前缀原则。 MVCC springboot的优势? git指令你用过哪些? 算法 一题 打家劫舍变种 dp秒了 二题 二分查找 秒了 #面经# #软件开发2024笔面经#
自我介绍 计算机网络五层模型 TCP属于哪一层,主要作用 HTTP与HTTPS有什么区别 Java的数据结构 链表与数组的区别 链表的底层实现 ArrayList与LinkedList 的底层实现和它们的优缺点 循环遍历链表,做插入删除会遇到什么问题 什么是哈希表冲突 怎么解决哈希冲突 哈希表的底层实现 用过哪些树,平衡二叉树有什么优缺点,时间复杂度 MySQL默认的存储引擎 InnoDB索引底层
最近一个面试都没有,只有一个wxg视频号约了一面(难度逆天,就当练手了),闲下来整理一下阿里云的面经,攒个人品。 一面(视频面) 耗时: 80分钟 golang 的 gpm调度模型,为什么要多个p --并发优化 context,channal,锁 之间的协程交互有什么区别 goroutine(图片压缩等等)处理调用超时怎么办 channal关闭了读和写会怎么办 channal的底层结构了解吗 TC
初试: 1.数据库索引相关 2.数据库事务 3.锁,死锁 4.hadoop,join的mr过程 5.数据倾斜及解决方案,如何采样大key不人工分拆 6.clickhouse,了解哪些其他olap数据库 7.数仓建模,事实表,维度表 8.一个新业务如何从0构建数仓 9.实习中遇到的问题,怎么解决的 10.sql 总体难度不大,但是我老是细节有问题 二面: 1.sql查询clickhouse过程,cl
先写结果,腾讯pcg某部门-软件开发-数据工程,3面挂了,其实挺难受的 知道结束的这一刻有点梗得慌,再忙毕业论文的间隙,还在面试。 感觉校招好难呀,终究还是我太菜了,写写面经,攒攒人品吧,也希望所有春招人有个好结果。 因为本身是个南方人,硕士是在北京念的,想去深圳发展; 虽然说在北京呆了3年,但是还是很想回南方发展的。 等最近忙完了,以后应该还会再战吧,真的想进🐧。 ==============
全程拷问项目 第一个论坛项目: 1.项目背景 2.说说项目中最复杂的部分(这一部分说了非常久) 3.第2点中的设计为什么要这么设计,有了解过业界中的方案吗?美团二面问过了,稍微说了一下。 4.为什么不直接使用现成的博客框架,你对开源软件有了解吗 5.说说你觉得redis中设计最巧妙的地方 6.对项目中redis的部分延伸拷打八股 第二个短链项目: 1.项目背景 2.说说最复杂的部分 3.有了解过业
bg:双飞本中9硕,一篇gnn的2区论文,无实习,两个toy project 4.11 腾讯PCG一面 项目1: KV存储是课程项目还是团队项目? etcd的集群leader选举策略(raft)场景:一个集群因为网络原因被分为AB两块,AB的leader会如何选举(超过一半以上的票数才能成为leader) 追问:如果通过配置让AB各自产生新的leader,然后合起来后如何选举leader?(根据t
介绍实习项目和实习业务 然后就是问mysql 接着一道重排链表,排成L1~Ln~L2~L(n-1),要原地算法,空间控制在O1。查中间节点用快慢指针,逆序遍历后半链表用链表反转 面试的时候🐖脑过载,非要用栈来逆序遍历,后面面试官说可以反转。多半挂了
巨人网络\春招\数据开发\笔试\hard 数仓-SQL面试题-实录 字段:uid 用户ID、artical_id 文章ID、in_time 进入时间、out_time 离开时间、sign_cin 是否签到 问题:统计每天的日活数及新用户占比 注: 新用户占比 = 当天的新用户数/当天活跃用户数(日活数) 如果in_time 进入时间 和 out_time 离开世界跨天了,在跨天的每天都记为该用户活
去年四月的暑期实习 二面: 自我介绍 大数据技术怎么学习的 了解哪些olap引擎 mr过程 mr的知识在实际工作中用到了哪些 300m,切片大小是128m,切几片 spark为什么快 rdd任务划分 spark优化 数据倾斜 哪些sql会造成数据倾斜 hive隐式转换 count distinct怎么解决 小文件缺点 数仓的意义 维度和事实的区别 维度属性是什么 维度建模的步骤 数仓分层 维度退化