2023年4月,大数据开发面试笔记V3.0发布,过去已经两个月,V4.0终于来了,这次主要新增了企业级调优手法以及数据湖基础等内容。如今面试越来越难,常常会被问到大数据的前沿知识比如数据湖,以及企业级调优手段有哪些等,于是我结合自己在大厂的工作经历进行了补充,最终汇聚成一份全面的大数据开发面试笔记。 此笔记包含大数据开发、Java、计算机基础、数仓理论、常考SQL、大数据开发场景题
在boss上投了简历,沟通之后,今天接到了可以线上面试的电话 (面试官说之前打电话都没有人接,因为之前我一直开的手机免骚扰,最近才发现这个问题,友友们记得看看拦截的设置,真的会错过面试电话) 问题(顺序有点乱,因为有的后面才想起来是前面问的) 1.自我介绍 2.介绍一下做的项目 3.项目详情 4.学校教授的课程有哪些、学python多久了、有哪些是用python的、python的基本知识 (插一个
一志愿 供应链管培 测评 挂 二志愿 物流运营专员 半个月后捞起 一面---- hr面 1.自我介绍 2.实习经历 3.项目经历 4.英语水平自我评价 5.没有问到与shein相关的 都是个人相关问题 二面----(hr小姐姐 和两位业务方面的 一共3位) 1.自我介绍(我问了中文还是英文)说都可以 我就中文了….其实准备好了英文 应该用英文的 2.项目中失败经历 3.对shein供应链或者电商供
英文原文:http://emberjs.com/guides/testing/testing-user-interaction/ 几乎所有的测试都有访问路由的一种固有模式,就是与页面进行交互(通过助手),然后检测期待的改变是否在DOM中发生。 例如: 1 2 3 4 5 6 test('root lists first page of posts', function(){ visit('/
25秋招-拼多多数据分析岗,回忆版,记不太全了 一面: 1.三道SQL题——涉及时间戳、字符串拆分转列 2.介绍实习时做的项目,深挖项目 3.假设检验实验周期怎么计算 4.怎么判断是否是小概率事件 5.中心极限定理 6.统计不显著,实际有轻微负向,怎么理解 7.乘法型指标怎么计算贡献度 二面: 1.SQL--店铺某年GMV降序排列,均分成十份 2.提高用户粘性的方案 3.AB实验的流程,结合自己的
写在前面:这个岗位重视可视化的能力,在去年一战失败后也投过这个岗位的正职,面试前和面试中都在问有没有相应的可视化作品,对于实习生希望熟悉sql和tableau,一来就可以干活 1.自我介绍 2.对于以往实习经历和项目浅挖 3.次日留存sql代码考察 4.询问了不了解窗口函数 5.利用窗口函数计算不同品类前十GMV 6.tableau和power bi知识点考察 -技术问题一直准备的sql,DAX公
我正在用Flink做一个实时项目,我需要用以前的交易丰富每一张卡的状态,以计算如下的交易特性: 对于每一张卡,我都有一个功能,可以统计过去24小时内的交易次数。另一方面,我有两个数据源: 在Flink流中使用静态数据集丰富数据流 任何帮助都是非常感激的。
我正在使用Flink表API,使用Java将数据集转换为数据流....以下是我的代码: ExpressionException:JavaStreamingTranslator的根无效:Root(ArraySeq((related_value,Double),(ref_id,String)))。您尝试将基于数据集的表转换为数据流吗?我想知道我们如何使用Flink表API将DataSet转换为Data
尝试使用Apache Flink从Cassandra获取数据,引用本文,我可以读取数据,但我不知道如何将其加载到DataStream对象中。代码如下: 我试过了 将变量中的数据加载到数据流中
我一直在阅读大量Spring Cloud DataFlow和相关文档,以便生成一个将在我的组织的云铸造部署中运行的数据摄取解决方案。目标是轮询HTTP服务中的数据,可能每天轮询三次,以便进行讨论,并在PostgreSQL数据库中插入/更新该数据。HTTP服务似乎每天提供10s数千条记录。 到目前为止,一个困惑点是数据流管道上下文中用于删除轮询记录的最佳实践。源数据没有帮助跟踪轮询的时间戳字段,只有
我试图用以下链接中提供的信息将Cassandra作为Flink中的数据来源: null 异常跟踪-->
我想把DStream发送到Kafka,但它仍然不起作用。 以下是一些错误信息: 16/10/31 14:44:15错误StreamingContext:错误启动上下文,将其标记为停止java.io.NotSerializableException:DStream检查点已启用,但DStreams及其功能不可序列化spider.app.job.MeetMonitor序列化堆栈:-对象不可序列化(类:s
我有一个无法解决的算法设计难题。 谜题的公式是这样的:有N个人站在一条数字线上,每个人都可能站在该线上的任何整数上。多个人可以站在同一个号码上。对于任何两个人能够相互交流,他们之间的距离应小于K。目标是移动他们,使两个人中的每一对能够相互交流(可能通过其他人)。换句话说,我们需要移动它们,使相邻两个人之间的距离小于K。 问题:总移动次数的最小值是多少?这感觉就像是贪婪算法家族或动态规划。任何提示都
第一次面试,hr+两个技术面试官,3v1,瑟瑟发抖 1.JS数据类型 2.如何判断JS数据类型 3.数组方法 4.H5新特性 5.CSS盒子模型 6.实现水平垂直居中 7.Vue组件间的通信方式 8.闭包 9.ES6新特性 10.call apply bind 11.本地存储 很多问题不知道怎么组织语言,15分钟结束,凉凉 👥面试题目
我想使用IB Api,但无法计算我们如何请求完整的符号列表和信息。 在我找到的文档中:reqScannerParameters()——但不清楚如何获得纳斯达克股票的列表? 有更好的办法吗?