Java的设计模式 100g的数据在小内存里如何排序(spark) Spark为什么比mr快 Hbase的适用场景 Hbase为什么快 和Clickhouse一样的数据库 Clickhouse底层数据结构 Clickhouse为什么快(很细) 两个sql(难度较大) Hadoop的高可用触发后,会发生什么(面试官说不要背八股,详细说里面的流程) Flink水位线 激活函数有哪些(sigmoid,r
timelime 9.5投递 9.13一面 9.17二面 9.19测评 10.7 21:00 收到意向邮件。 ---------------------------------------------- 防定位,面经先匿了。 #晒一晒我的offer##天翼云##大数据##秋招##国企#
总时长30分钟左右 1.自我介绍 2.大数据学习过什么技术? 3.数据工作有哪些岗位? 4.写一个二分法 5.一道sql,从表中提取出所有课程分数大于90的学生id 6.最近在学什么新技术? 7.进程和线程的区别?哪个开销比较小? 8.tcp和udp区别 9.职业规划 10.反问 总结:最近看测试内容比较多,对于大数据了解不多。面试官态度挺好,还要补的东西有点多我,sql都没写出来。找工作找得失去
30min 自我介绍 项目: 介绍一下项目 几层。每层干了什么。去掉一层可以吗(又来) dwd和dws和ads都可以去掉 balabala 数据量 千万级别数据怎么同步? 业务datex+maxwell,行为 直接flume拉。 多久同步一次? 一天一次。 Ads层怎么接到可视化看板? 手拉(这边傻逼了,忘记说接clickhouse同步然后接到可视化软件上了) Zk在kafka里的作用? 保留of
就面了十几分钟 面试官说我更适合去做算法 1.实习经历 2.数仓和数仓建模的理论知识(我说了维度建模 范式建模 问知不知道维度退化 不知 3.SQL:怎么找A表有B表没有的数据 数据倾斜怎么处理(不会 #发面经攒人品#
五一前收到了暑期实习oc,记录一下时间线~ 4.8投递 4.23上午一面 4.27下午二面 4.28傍晚收到短信、邮箱、hr电话,收oc啦! 5.4今天上午收到邮件填了入职信息 base北京(望京东,要合租的女宝子请戳我!) 总结一下,我暑期实习4月份才开始投,算是比较晚,所以团子一面我的第一场面试,当时感觉回答的很不好,心里准备是直接进人才库的,收到二面通知时挺惊讶的,然后好好准备了项目,想要抓
ps:(我在他们子公司实习了1年) 自我介绍 子公司实习工作内容 介绍论文方向,稍微提问了一下 对东电了解吗 根据简历提问: 数据湖和数据仓库区别,优势 自己搭建过数据湖吗 (简历没写专科经历, 中途hr突然问我专科在哪上, 高考分数) 总结:挺轻松的,面试了大概30分钟,但是感觉面试这个公司目前没有真正的大数据团队,只有算法和开发团队, 听面试官意思是领导近期想组建大数据团队,所以开始招人。 纠
10.1 -1面:面试官在家,聊的很开心,后边几乎都是我在说自己做了什么,感觉很尊重人 10.11 -2面:面试官很亲切,一开始想电话面,然后问我在哪,我说在面试平台上,又改到了平台面(很尊重了。期间问了各大组件各大知识,加一些场景比如下游不支持事务和幂等,怎么来做精准一次,就是会问一些没有答案的问题,然后根据你的答案提出问题,直到不会。(名场面:你遇到OOM吗;我遇到过;那你谈谈什么时候遇到OO
1面:问了大数据平台知识 2面:聊天30分钟 3面:聊天13分钟 开奖应该是白菜32-28#2023秋招offer#
暑期实习(投得算是比较早),来和大家分享一下面经~😀 流程:顺丰流程个人感觉挺高效,体验也非常不错。 投递完之后就测评 4-15 显示简历通过安排面试 4-24 一面结束 代码是手写单例模式 4-25 二面结束 HR面 4-29 邮件offer (以下面试问题不是按照时间顺序,是按照个人回忆的顺序😅😅)我的技术栈是Spark方面的。 1.自我介绍,详细介绍一个个人的关于分布式系统开发的项目
一面 实习介绍 设计过哪些数据指标,这些指标的意义 项目介绍 具体分层怎么做的 表怎么设计的 对数仓和数据湖的理解 连续登录3天的用户 问的太少了,估计没想招我 #面经##大疆#
开局闲聊: 为什么没有去实习?我说和老师项目冲突没时间(就是老师不放实习) 硕士期间有没有发论文? 后面技术面: 1. JDK源码设计模式 2. 单例和工厂模式区别 3. DDD怎么设计实体和值对象(学习项目写了DDD) 4. DDD和微服务怎么对应 5. 为什么将数据库行锁优化为RedisKey加锁 6. 数据库会崩溃,并发量较大时不选择数据库选择什么存储? 7. Redis持久化 8. RDB
11.3 一面 1.自我介绍 2.实习时间 3.实习内容 4.学习中遇到的难题 5.最大的收获 6.实习中发现的问题,如何发现问题,解决的效果 7.Union和union all 的区别 8.索引介绍? 9.表经常被修改对索引具体有什么影响 10.公司业务部门规模 11.实习中做需求的速度 12.实习中遇到的问题 13.遇到不好沟通的人怎么办 14.上面派你监督你不负责的任务的做法 15.六级分数
30min 自我介绍 项目介绍 项目难点介绍 hadoop组件有哪些 hdfs简单介绍 hdfs怎么实现高可用,具体 是哪个进程在zk上注册临时节点 hdfs怎么防止脑裂 hdfs写流程,写到一半client发生OOM之后该怎么办,datanode宕机怎么办 怎么实现nn切换,而客户端无感的 Spark提交作业的流程 Executor内存管理,分别存储什么 spark shuffle有哪些,讲一下
35min 1面 自我介绍 排序算法知道哪些 稳定的排序算法有哪几种 mr和spark的区别 bitmap解释一下 bitmap用途有哪些 布隆过滤器的原理 一道dp题,口述思路没想出来。。。 三道业务场景题 30min hr面 常规hr面 vivo流程真快,爱了,九月底开奖 #大数据开发##大数据开发工程师#