最近面试强度上来了...两天四场 饿了么一面(40min): 介绍下实时项目 对DWD和DIM层的理解,构建过程(背了套理论,面试官听笑了..) 开发DWS层的目的(避免重复建设,数据一致性) Hive倾斜优化 kafka底层数据存储(log文件分段,稀疏索引,mmap,零拷贝) flink状态 flink checkpoint作用 一道sql题 没实习被diss了,面试官说做数仓的话更看重对业务
一面6.14 45min 挖简历项目 机器学习线性模型口诉原理(简历提到机器学习) 手写最大子数组和(ac通过),要求nlogn复杂度。(提示递归,未答出) 无八股 二面6.18 1h 挖简历项目(详细介绍项目、随口问了下springboot与jdk版本 、MongoDB原理,elasticsaerch等) 场景题:抢购平台,有哪些与异常相关的字段,比如用户订单等信息。如何设计异常检测大数据平台
2023年4月,大数据开发面试笔记V3.0发布,过去已经两个月,V4.0终于来了,这次主要新增了企业级调优手法以及数据湖基础等内容。如今面试越来越难,常常会被问到大数据的前沿知识比如数据湖,以及企业级调优手段有哪些等,于是我结合自己在大厂的工作经历进行了补充,最终汇聚成一份全面的大数据开发面试笔记。 此笔记包含大数据开发、Java、计算机基础、数仓理论、常考SQL、大数据开发场景题
一、选择题 总计20道 408内容+大数据框架(Hadoop、Spark、Flink等) 有单选,也有多选 二、编程题 第一题:小红书推荐系统 统计热点词频;输入一个字符串,统计词频后,按照词频从高到低打印热搜单词(出现次数超过3,同时对于两个词频相同的单词,要按单词字典序打印 public static void main(String[] args) { Scanner sc = n
在boss上投了简历,沟通之后,今天接到了可以线上面试的电话 (面试官说之前打电话都没有人接,因为之前我一直开的手机免骚扰,最近才发现这个问题,友友们记得看看拦截的设置,真的会错过面试电话) 问题(顺序有点乱,因为有的后面才想起来是前面问的) 1.自我介绍 2.介绍一下做的项目 3.项目详情 4.学校教授的课程有哪些、学python多久了、有哪些是用python的、python的基本知识 (插一个
1.自我介绍 2.说一下数据库范式 3.说一下Hbase 4.Hbase的rowkey怎么设计的 5.说一下Clickhouse 6.说一下你了解的数据库底层的一些知识 7.数仓为什么这样分层 8.数据表和数据视图的区别 9.实习 数仓让你觉得有成就感的地方 10.你对离线感兴趣还是对实时感兴趣 11.你知道OLAP数据库都有哪些 12.Sql题 13.Hive Spark优化掌握的怎么样? 14
问题内容: 我试图了解线程如何在Java中工作。这是一个简单的数据库请求,返回一个ResultSet。我正在使用JavaFx。 这将返回一个异常: 线程“线程A”中的异常java.lang.IllegalStateException:在FX应用程序线程上不;currentThread =线程A 如何正确实现线程,以便每个数据库请求都在第二个线程而不是主线程中执行? 我听说过要实现Runnable,
我试图理解线程在java中是如何工作的。这是一个返回结果集的简单数据库请求。我正在使用JavaFx。 这将返回一个异常: 线程“thread A”java中出现异常。lang.IllegalStateException:不在FX应用程序线程上;currentThread=ThreadA 如何正确地实现线程,以便在第二个线程而不是主线程中执行每个数据库请求? 我听说过实现Runnable,但如何在r
达发一面( 系统软件研发工程师 )-当场点名被刷 苏州的达发,本人是23届毕业的本三211硕士,一面记录一下, 9月中旬号投的简历,面试时间是9.19笔试,9.23面试,40分钟。 问题: 1自我介绍 2怼项目 3项目负责的部分讲解,各个框架捋一下 4追问项目中遇到的难题 手撕(字符串压缩)c语言 设计一个简单的压缩功能,对字符串中的重复字符进行计数,并将计数加到该字符后面,如果计数为1, 则不加
问题内容: 在学习pandas的过程中,我试图迷惑了这个问题很多月。我在日常工作中使用SAS,这非常有用,因为它提供了核心支持。但是,由于许多其他原因,SAS作为一个软件还是很糟糕的。 有一天,我希望用python和pandas取代我对SAS的使用,但是我目前缺少大型数据集的核心工作流程。我并不是说需要分布式网络的“大数据”,而是文件太大而无法容纳在内存中,但文件又足够小而无法容纳在硬盘上。 我的
我正在尝试重新开始使用Spring Boot开发工具。我一直遵循此处提供的说明:https://docs.spring.io/spring-boot/docs/current/reference/html/using-boot-devtools.html 我正在使用gradle,并将其包含在我的build.gradle文件中: 我创建jar文件并运行jar文件: 我能够通过Intellij连接到正
我的管道是IoTCore->pub/sub->Dataflow->bigQuery。最初,我得到的数据是Json格式的,管道工作正常。现在我需要转向csv,问题是我使用的Google定义的数据流模板使用Json输入而不是csv。是否有一种简单的方法通过数据流将csv数据从pub/sub转移到bigquery。模板可能会改变,但它是用Java实现的,我从来没有用过,所以需要很长时间来实现。我还考虑过
我在 Azure 数据工厂中具有事件触发器,它在 Azure Blob 存储中创建新 Blob 时触发。但我的触发器在创建 Blob 时没有触发。 已按照以下链接进行操作,但卡在下面提到的点:Azure 数据工厂:事件未启动管道。 环境详情: 事件网格已注册,ADF为v2并将参数传递给管道。我的问题是我是否需要激活Azure存储事件订阅?如果是这样,我的事件处理程序应该是什么(在我的情况下是ADF
微信小程序开发工具快速二维码编译跳转的页面是指定页面?还是怎么弄的 我发现我们公司的通二维码编译跳转到了这个页面 这个页面路径需要自己设置吗? 小程序模拟器上的页面路径却不是这个jump的路径 而是其他的路径 pages/login/login-check/login-check
▫️Timeline:3.13投递 - 3.15完成综合考试 - 3.27请求转到第二志愿 - 4.11一面 - 4.21二面 - 4.25HR面+英语测评 - 4.26收offer ▫️bg:美本专业对口,一段相关实习,两个项目(1机器学习,1rfm) ▫️一面(~45mins) - 职业学业规划 - 回国时间&到岗时间&实习时长 - 自我介绍 - 介绍实习内容 - 实习怎么搭建指标体系 - 实