(被捞起来重新面) 总共40min 手写模板方法,责任链模式(项目中的) spark和mr有什么区别,为什么spark比mr快 磁盘和内存 有有向无环图的这些优化 什么更优秀呢,什么原因导致比mr更快(不知道) spark里面,checkpoint和cache有什么区别,分别用于什么场景(场景完全忘记了) 数仓是怎么分层的 什么是业务过程(不知道) 事实表设计的步奏是什么(不知道) 三范式建模和维
为啥官网上写着java 数据库,结果面试全问我C++,这几天看的数据库都没问啥 30min 1. 自我介绍 2. 说一下Linux和常用命令,线程和进程的区别 线程和进程的本质区别是什么 3. Linux如何查看是哪一个进程占用率指定端口 4. C++了解到什么程度 5. C++中的const和底层const 的区别 fun(int i) fun(const int i)有什么区别,编译器怎么看
状态最不好的一次,面试官说话温温柔柔的我本来中午就没睡感觉快要睡着了 腾讯会议,对方没开摄像头(整个屏幕都是我的脸) 自我介绍 然后问了对数据开发的了解 数据建模、数据分层 然后就开始共享屏幕写sql(本来让我写hive sql,我说我不会) 三道题,写的稀碎... 主要是问题的逻辑我理解不了,再加上自己sql写的没那么熟练,在加上我真的好困啊 然后写完了 他就和我说,多练练sql,别搭虚拟机框架
#软件开发笔面经# 1、自我介绍 2、面试官:你倾向于数仓还是数开。我:实习做的数仓,所以更倾向于数仓。面试官:好的,我们是做后端开发相关的 3、说一下实习期间做的工作 4、介绍下你的第一个项目 5、了解过zookeeper吗 6、spark中dataframe和dataset的区别 7、简单说一下kafka是干什么的,消息能保证全局有序吗 8、了解容器吗,docker和kubernetes 9、
1.挖项目 2.jvm垃圾回收 3.找问题,String类型循环内使用+= 4.mysql 聚簇索引和非聚簇索引 5.hashmap原理 6.索引数据结构(b+树),特点 7.hive数据倾斜 8.hive mapjoin ,bucket map join ,SMB join 9.flink watermark 10.flink checkpoint. 三种分布式快照算法 11.flink 状态
1.自我介绍、成绩排名、读研计划、奖学金、是否挂科、有无数模竞赛经历 2.介绍项目,数仓设计中主要考虑的点 3.开发用的语言 4.项目数据量多少,报表用什么软件做的 5.实习工作介绍,dqc怎么用的 6.实习最难的一点是什么 7.机器学习和深度学习了解吗 8.python常用的包 9.rdd和dataframe和dataset的区别 10.hive查询过程怎么优化 11.你的性格在工作中的优势 总
更多面经在同名xhs 百度产品经理面经 百度百科产品经理面经 一面 35分钟,面试官是PMO 自我介绍 未来想在北京还是上海 为什么想做产品经理 讲一讲在美团的实习经历,介绍一下具体的项目和成果 介绍一下在小红书的实习,做了什么事情,有什么收获 有没有用过百科这个产品? 你对百科最直观的使用感受是什么?你觉得这个产品它现在的呈现方式有什么样的问题? 有没有了解过其他的百科产品?比如维基、头条百科
一共两轮技术面一轮HR面,第一轮面试hive 问题居多,第二轮hadoop 问题居多,整体来说问题不是很难,方向为数仓。 一面: 11.30下午 牛客网面试 30min 自我介绍 数仓项目介绍 什么是全量表,什么是增量表,以及应用的场景 了不了解拉链表,讲一下拉链表如何生成 什么是内部表,什么是外部表,有什么区别 Hive中小文件形成的原因及解决办法 Hive SQL的优化方法 讲一下熟悉的窗口函
#互联网公司爆料# 这个公司也是搞物流的吧,估计是做国外的,面试我的第一面是大数据组长,应该是数仓的组长,主要是数仓建模,hive基础,以及spark,以及数据服务以及做的项目的细节,整体面试还可以,终面是技术最高负责人,估计是个副总有40多岁,问了我大数据集群怎么搭建的,服务器是怎么设计的,对于大数据的架构的分布等等吧,感觉是以架构师来问的,薪资好像是15乘14,年终估计拿不满吧,终面还挂了,好
1.Spark的运行机制 2.union是宽依赖还是窄依赖 3.常见的action算子 4.reduceByKey和groupByKey的区别 5.Spark的checkpoint 6.Spark的cache和persist区别 7.Flink的checkpoint和Spark的checkpoint区别 8.Flink的两阶段提交问题 反问 用什么做什么 基本大数据组件都会用,shein数据量大而
最开始发来的邮件说是电话面,当天走完了一面二面,中间只间隔了二十多分钟,当晚HR面,第二天看状态结束了。。。。凉凉 这次幸亏是电话面,手机直接录音了,记录的详细一些。 一面 面试时间:20min 自我介绍? 实习工作介绍,实习内容,所用的技术栈。。。 怎么和同事配合的?自己有开发了那些?有什么提高? 你们这个项目,你觉得还有那些地方可以做优化? 离线和实时结合,未来发展的一些看法? Hive的组成
主要问经历,问项目的比较多 hdfs的角色有哪些,功能 hdfs的写流程 Java的线程安全是什么 最熟悉的集合是什么?详细描述一下 Arraylist为什么长度可变 python的装饰器用过没?是什么东西? 手撕python编程题,给定一段字符串,统计出每个单词的频率,频率相同的按降序排序 外部表和内部表的区别? 为什么选择多益? 对游戏的流失人数进行分析? 有没有拿到其他公司的OFFER
1.自我介绍 2.实习技术难点 3.项目技术难点 4.id timestamp 位置 三个字段完全一样的去重,sql怎么做scala怎么做 挑选同个人最后一个时间戳的记录,sql怎么做scala怎么做 5.spark submit提交参数 6.内存/并行度参数优化方案和技巧 7.当出现数据倾斜的时候怎么排查,怎么处理 不能只提八股,要完善分情况的答 8.两数之和 9.小数之和 10.反问,写sca
同程offer到手了,补一下同程旅行的面经 岗位:算法工程师 base 北京 一面 技术面 主要问实习项目,然后结合项目问了一些八股 如果模型不收敛如何解决 如何判断训练过程中出现了梯度消失还是梯度爆炸 如何解决梯度消失和梯度爆炸 平常用哪些激活函数 介绍一下selu和swich激活函数,有什么优点 你在模型训练的过程当中用到了哪些小tricks 二面 技术面 为什么不继续做cv投搜推算法 实习项
14:46到15:06 只记得部分问题。 ①说一下对java的多态的理解 ②ArrayList和LinkedList的区别 ③Redis和MySQL怎么保证数据一致性 ④线程的可见性 ⑤现在有三个线程,如何实现按顺序执行线程? ⑥讲一下final关键字 ⑦是否接受转C++ #烽火通信##烽火通信面试#