10.10 一面 12min 明明写的数据开发,招的是数据挖掘..... 全问的算法,一个大数据的东西都没问 满满的槽点,邮件上写的面试时间20min,然后一直等,然后hr说是上一个人还没面完.....再怎么没面完也不会让人等超过20min吧,结果等了半个多小时.......还是3个专业面试官,面试就12min,明明写的是大数据开发岗,说我怎么经历都是数据开发......招的又是数据挖掘,直接单开
一共两轮技术面一轮HR面,第一轮面试hive 问题居多,第二轮hadoop 问题居多,整体来说问题不是很难,方向为数仓。 一面: 11.30下午 牛客网面试 30min 自我介绍 数仓项目介绍 什么是全量表,什么是增量表,以及应用的场景 了不了解拉链表,讲一下拉链表如何生成 什么是内部表,什么是外部表,有什么区别 Hive中小文件形成的原因及解决办法 Hive SQL的优化方法 讲一下熟悉的窗口函
粉丝投稿,两年数据开发经验,面试博时基金的数据开发岗位。 开局是亘古不变的自我介绍,和面试官寒暄几句就开始面试了。 1、能简单介绍下你们的组织架构? 2、你们数据相关的都有什么系统? 3、你们团队有多少人? 4、数仓的数据量多大? 5、除了o层,数仓有多少任务? 6、数仓的任务要跑多久? 7、外部数据平台数据的流向? 8、外部数据平台有哪些数据入到数仓? 9、数据交换平台的应用场景? 10、你们大
一面(技术面)1小时 自我介绍; 介绍一下实习; Flink数据倾斜的原因? Flink如何保证数据不丢失? 介绍一下数据流和数仓架构? 解释一下被压? 介绍一下CheckPoint机制? 团队的工作和你的工作? 什么是AB测试? 现在的架构是什么? 如何保证实验层之间的正交? 产出的核心指标是什么? 实验的显著性如何计算? 实验的合规问题? 合规改造问题的设计思路? 二面(综合面)45分钟 自我
#24届找实习方向# 1. 介绍基于Spark实时项目 2. Spark在这个项目中做了哪些工作 3. Spark中,说说Action算子和Transform算子的区别?常见的行动算子有哪些? 4. 这个项目有考虑使用Flink处理吗? 5. Flink中窗口的种类有哪些 6. 了解数据库的底层逻辑吗 7. 说说主键索引和外键索引的区别 8. 计算机网络中OSI七层协议,说说他们的作用 9. 如果
#互联网公司爆料# 这个公司也是搞物流的吧,估计是做国外的,面试我的第一面是大数据组长,应该是数仓的组长,主要是数仓建模,hive基础,以及spark,以及数据服务以及做的项目的细节,整体面试还可以,终面是技术最高负责人,估计是个副总有40多岁,问了我大数据集群怎么搭建的,服务器是怎么设计的,对于大数据的架构的分布等等吧,感觉是以架构师来问的,薪资好像是15乘14,年终估计拿不满吧,终面还挂了,好
本人24届某211大数据专业,字节也是本人的第一个面试。 首先是一个自我介绍, 然后问了项目的东西, 比如用的是维度建模嘛,用了什么事实表,用了什么业务,事实表有哪几种分类 项目中的数据域是怎么划分的。 然后问了MapReduce的执行流程,问了一个Map阶段的数据切分函数(没答上来),又问了MapReduce可以不要map嘛。 接着问了spark,问了spark和Hadoop有什么区别。 hiv
题型:15道选择题,其中有单选和多选;3道编程题,核心代码模式,为了方便调试,本文提供ACM 笔试太难了?可以私信我 有些AC有些通过率还行,助攻已经进面了 在TCP/IP协议的传输层将数据传送给用户应用进程所使用的地址形式 A.端口号 B.socket地址 C.IP地址 D.MAC地址 多选 高并发测试中,数据库数据问题往往出现很多,下面关于隔离级别描述正确的是 A不可重复读:同个事务前后多
一面 4.23 当天下午约二面 (点错成周四4.27了摔😤 lz面过最长时间的面试,足足1h40min,10:15开始,结束都快12点了🥲也不知道是面试官工作比较闲还是lz太话唠了🤣 Part1: 实习经历 团子的面试官好像对我的实习经历非常感兴趣,一直在深挖,问得非常非常细,到具体什么指标、数据是多少这样子,这一part直接干了四五十分钟😳有记不得的lz就直接说记不得…但是面试官挺好滴,
1h16min 1、将一下对大数据开发的理解 2、是通过什么接触到大数据开发的?为什么选的是实时? 3、大数据专业有没有学过flink相关课程,你是自动化学院的,如果我招你来你会不会只是学一下就算了,毕竟培养一个人要耗费很多精力 4、对于实习时长能接收多久,后续会不会考虑留在北京 5、有没有了解过美团 6、为什么项目中要使用flink,相比于其他的使用flink的好处在哪里 7、数仓分层为什么是五
一面 4.6 视频面 本来说好视频面,差不多晚上8点打了个电话说电话面,聊了30分钟基本没怎么问技术问题。 二面 4.10 现下面,聊了10分钟天,面试官说他搞算法的,问了个技术问题clickhouse有什么可以代替,这题没答上来。G
1.Spark的运行机制 2.union是宽依赖还是窄依赖 3.常见的action算子 4.reduceByKey和groupByKey的区别 5.Spark的checkpoint 6.Spark的cache和persist区别 7.Flink的checkpoint和Spark的checkpoint区别 8.Flink的两阶段提交问题 反问 用什么做什么 基本大数据组件都会用,shein数据量大而
ap.sendSocketMessage(OPTION, CALLBACK) 通过 WebSocket 连接发送数据,需要先 ap.connectSocket,并在 ap.onSocketOpen 回调之后才能发送。 OPTION 参数说明 名称 类型 必选 描述 data String/ArrayBuffer 否 请求的参数 代码示例 <script src="https://gw.alipay
蓝天采集器(SkyCaiji),网页爬虫系统,采用 PHP+Mysql 开发,可部署在云端服务器和虚拟主机中,使用浏览器即可采集数据。软件免费无限制使用,规则和插件可自定义开发。
9.14一面 数仓维度建模 离线数仓和在线数仓的构建流程 MapReduce过程 三道编程题: java无重复字符的最长字串(我实习也撕这个) 行列转换(一行变为多行,用mysql,不会。。。) 窗口函数序号函数三个(简单) 问我有没有收到其他公司的offer 将近1h,居然过了,我以为我挂了 9.21二面 这个面试官感觉说话慢悠悠的,然后不怎么问问题,我觉得是KPI来着 项目经历 实习经历 数仓