秋招拿下字节、京东、tcl、微信产品,滴滴商分满帮数分,可免费帮看简历,需要的话评论区留个言一面(所有回答为脱敏比较简略仅说关键词,详细的回答思路可以私戳我) 往期面经可以看我之前的帖子呀,求哥们别举办了 二面(所有回答为脱敏比较简略仅说关键词,详细的回答思路可以私戳我) 介绍一个你觉得做的比较好的项目使用star法则(背景、任务、行动、结果)介绍介绍背景时强调当时的背景以及需要解决的痛点描述任务
一面 自我介绍 项目介绍 大概讲了一下项目里多线程并行加速得方法,面试官感觉不是很懂没有多问 然后又介绍自己写的推理框架,面试官也不是很懂,没怎么聊 手撕代码:最长上升自序列 一共面了20分钟不到 二面 自我介绍,简单介绍了三个项目 先详细介绍了第一个项目,说了一下算法得流程和自己优化推理加速得部分 问了一下里面多线程得同步,用的时c++里面的什么数据结构 里面模型加速都用了哪些方法 介绍了一下自
2022-07-22 时长1h 1 自我介绍 2 数仓项目数据量多大 3 几个shell问题,监控spark日志内容并写入到另一个文件、实时监控spark日志内容 4 Java关键字、面向对象三大特征、接口和抽象类区别 5 set list map区别 6 介绍JVM内存区域,String是基本数据类型吗?基本数据类型变量存在哪里 7 垃圾回收机制 8 新生代老年代对象是如何流转的 9 创建线程的
2022-07-27 下午 时长1h5min 百度的面试官真的很好,这点没得说 1 自我介绍 2 数据倾斜——结合业务说了分组聚合和join,大表大表join怎么解决数据倾斜,展开说 3 SQL 没做出来,但是面试官全程提示,沟通交流 4 Hive和Spark哪个比较熟悉,我们聊一聊——都比较熟悉,问了Hive组件和底层执行逻辑,逻辑计划优化有哪些方法,什么是谓词下推(自己提到了) 5 算法:数组
28min 一位很友好的大哥,感觉问的比较简单全程没有怼我,希望不是KPI面😓 一面 开问: 自我介绍? 介绍Spark 项目? 介绍数据仓库项目,怎么建模怎么分层的? 数仓分层的优点在哪里? 项目里面提到了留存率,你怎么计算留存率的? TCP说一说? TCP和UDP区别说一说? A 3条数据,B 4条数据 A left join B 结果会有几种情况? 双流join 讲一讲? 缓存过多你的解决
写面经,攒人品! 顺丰一面(9.13):26分钟 1. 自我介绍 2. 介绍实时数仓 3. Flink CDC原理 4. Spark Streaming和Flink的区别 5. Flink的作业提交流程 6. Slot是怎么进行一个资源的分配 7. Flink如何检测数据是否产生背压 8. Flink窗口的实现原理 9. Flink的watermark 10. Flink的端到端一致性 11. J
1-4面为春招实习,很遗憾最终没有通过,5-8面为秋招投递同一个部门,hr面后通知说换了一个组加一轮技术面和hr面,总体来讲实习面试更侧重实验室项目,秋招面试会细聊实习工作,每一轮的面试官都很nice,也都是一次很好的学习经历,感恩这一年和蚂蚁的相遇~ 一面(技术面) 介绍项目 遇到了什么问题 怎么解决的 介绍一下大数据的发展历程 项目选型,为什么用这些组件 介绍另一个项目 除了准确率还用了什么指
一面: 一共是三位面试官进行的专业面,是两位专业面试官和一位HR 专业面试官会针对简历提一些细节性的问题,以及一些对于负责产品的深度思考HR则会问一些对于职业的规划和选择职位的影响因素 面试一共四十多分钟,难度中等。 二面: 一整个会议室的人公开看一组同学的表现,每组一般五六个人,也会存在同组同学面试调整的情况 面试时会要求同学在自我介绍以及回答问题的时候直立露出上半身回答 提问的问题会有一些
二面就问了20min不到,吓死我了,不过已经发offer啦,分享下二面问的一些题目。 还是挖简历。 数仓建模核心 拉链表、快照表、全量表的区别 好像就这些~
1. 简历深挖 2. mysql binlog了解吗 3. shell脚本写过吗 4. 两个集群,一张hive表如何进行数据共享,A集群如何同步到B集群中 5. 一张订单表,支付状态会发生变化,如何采集到ods? 面试官说由于每张mysql表都是在系统上有应用的,所以应该用update的方式更新支付状态,不能采用数仓的方式去思考问题,不能用拉链表。数仓可以保存历史数据,但是mysql表必须要用up
年前面试的 流程是机考,测评,再面试 (数仓)一面 聊得还行,不知道怎么挂了。。。可能是Spark这一块了解得太少了 自我介绍 你做的项目数据采集用的什么工具和原理? 有没有做过数据治理? 有没有做过数据血缘关系管理? 数据突增问题有没有遇到过?影响HDFS,如何解决? Hive表格存储用的哪个?什么原理? 数据某个阶段出现问题了,你怎么样定位出来? 数据倾斜有没有遇到过?怎么处理的? 数据之间的
一面:boss直聘,拷打项目,无八股。面试官简单介绍了项目的情况,反问。 二面:电话面,面试官一眼看出项目是网上的,我狂妄发言:“我是有自己的思考的”,然后被拷打,最后只憋出来了一条。 根据我之前的回答,面试官问了 1)数仓,业务系统,大数据平台的关系 根据jd,问了 2)py如何连接数据库,数据库游标、连接不释放会怎么样 3)hive分桶表,如何分桶,如何确定分桶的数量,分桶有什么用 4)怎么处
今天面了字节大数据开发的三面,记录一下: 面试官先自我介绍,然后开始问专业知识。 1.你了解实时领域和离线领域的哪些技术? 2.mapreduce和spark作为计算引擎的差异 3.spark的rdd是什么 4.如何理解rdd中弹性的概念 5.spark有哪些调优方法 6.spark中的join操作有哪些 7.数仓建模方法有哪些 7.介绍一下flink的双流join,以及双流join可能会遇到哪些
游戏开发——数据工程,50分钟 问的都是八股 四类访问权限;四种内部类;反射机制;JMM内存模型;ArrayList和LinkedList;final VS finalize VS finally; 两道编程题: 有序列表合并;最长回文串 等消息
问题内容: 我想使用python使对数正态分布适合我的数据。根据手册,返回 形状,位置,比例 参数。但是,对数正态分布通常只需要两个参数:平均值和标准偏差。 如何解释scipy函数的结果?如何获得均值和std.dev。 问题答案: scipy中的分布以通用的方式通过两个参数的位置和比例进行编码,因此位置是将分布向左或向右移动的参数(),而是压缩或拉伸分布的参数。 对于两个参数的对数正态分布,“均值