自我介绍 深挖简历 做算法题 凉————凉
腾讯会议一面(30分钟) 自我介绍 项目介绍 数据如何采集,整个流程叙述一遍 项目难点说一下 两个项目的区别讲一下 数仓分层里面的表叙述一下有什么 分析一下两个事物之间的关系,怎么分析(有点抽象的问题),有什么经验
1.自我介绍。说多了被打断了,寄😫。 2.介绍项目背景和内容,主要做的工作。 3.项目中的数仓是依照案例开发还是自己设计的?模仿开发过程,实现数据域的开发。 4.项目中有宽表设计和hive调优,如何做的。讲了宽表设计原因和退化的维度,hive调优主要做的数据倾斜,将热点数据拆分出来,单独处理。 5.单独拆分多出一张表,增加了存储压力,有什么帮助吗。数仓设计理念就是用空间换取时间,不怕数据大,就怕
这是阿里巴巴的一个研发岗位,涵盖一些大数据的笔试 专业面试问题 #软件开发2024笔面经# 针对过往经历 Q:字节确实注重数据驱动,这样子的决策方式可能会有什么问题?哪些决策没办法用这些方法进行验证? Q:结合过往实习经历,你现在想要帮商家提升GMV,你觉得该如何去进行提升? 行为面 Q:在这几段实习经历中,哪段需要联系各方的人推动解决问题的情景更多? Q:在合作过程中遇到比较多的卡点是什么,导致
#软件开发2024笔面经# 0)项目中遇到哪些问题? 1)业务数据采集框架选择(FlinkCDC,Maxwell,Canal) 2)Dwd 层新老访客修复、Dws层用户回流状态过大,选择状态后端不合理导致OOM3)状态后端选择 RocksDB导致链路延迟过高 4)Dws层读取外部数据库维度数据网络延迟过高导致反压 5)数据倾斜导致的反压 6)Flink SQL 未设置 TTL 导致的 OOM 7)
自我介绍:是怎样的人,有怎样优势,做怎样改进 岗位是否匹配预期 介绍工作内容 业务方沟通需求 整理数据,提出数据,可视化 提供给业务方 能力:沟通,数据分层实践 数仓了解多少 机器学习拷打 SQL考察 思维题 什么是数据分析 面试官简述数据分析理解 反问
1.自我介绍 2.熟悉flink还是spark 答:flink 3.介绍下flink架构吧 答:这里越深越好,我就讲到了flink的jobmanager(dispathcer,jobmaster)和taskmanager 4.flink有哪些算子? 答:map,flatmap,filter,window,union等,RichFunction提供生命周期open close,上下文环境。 5.fl
0八股,全程问之前实习和做的项目,问实现细节和设计架构,聊了40min。期间我有不会的,或者说的不完整的,面试官也给我展开讲了。 十分钟手撕代码,两种方法写出来了。 发个面经贴,攒攒人品🙏
04-09 一面 04-16 二面 04-25 hr面 04-28 offer 差不多每周推一次进度, 暑期实习唯一一个offer, 很满意了
上海一家小公司,啥也没问,然后就过了,会不会有诈啊我靠,就说实习生也不要求干啥,但是他那边说干数据库的,开发为辅,感觉对技术提升不是很大,而且感觉有坑😅
时间流程:我是在boss上投递的,其实去官网投递更好。建信金科,厦门的数据分析建模岗位。4.17上午初面,下午就发了笔试通知。4.19上午二面,4.20笔试,选择题,一道字符串题,一道SQL题,需要用手机扫二维码,占用了手机设备,导致我当时查不成信息。 面试内容: 自我介绍。后面主要是针对项目内容详细询问,两次都问到做的评分卡模型是怎样筛选特征的,不平衡处理方法。 期刊是几作,论文等级,论文相关内
一面(4.24): 总体30 min 1.为什么在上一家公司离职 2.对公司有什么诉求 3.理解到你的诉求是想提升技术了,那假如在公司干活不能提升你的技术那你会怎么办(跑路) 4.你希望自己以后成为什么样的人 5.AB test 6.标准明细表(没太听懂) 7.数仓的分层 8.spark为什么比MR快 9.项目中具体干了什么活 10.你觉得沟通很重要吗 11.如果你有简单的方案可以完成业务方的需求
来源:boss 内容:自我介绍 校内数据分析的课程用到的工具 为什么选择南京 上一份工作中数据处理的内容是怎么做的 期望薪资 用axure干嘛 经济学课程有没有涉及到数据 平时数据来源在哪 家里有没有兄弟姐妹 去南京家里有没有意见 现在在哪 什么时候可以到岗 有没有关注财经的信息(想问一些证券的内容,抱歉,我一点不懂) sql查询的语句,因为不会而延伸到access实验课成 未来工作规划 能不能接
我傻了,一个八股没问,而且我好像说错话了,完蛋了😭 团子给我个机会吧
👥 面试题目 1.自我介绍,能不能从几个方面说一下项目 2.有什么收获 3.简历里面哪个技术学的最好 4.spark的client模式和集群模式 5.yarn 6.能够重分区的算子 7.为什么用rdd,不用df和ds,他们的区别 8.为什么spark比mapreduce更快(磁盘io和进程线程模型) 9.spark也会OOM和溢写磁盘啊,mapreduce也有缓冲区啊,都是内存计算,为什么更快(