面试内容 一面(乙方): 1、聊一下熟悉的数据库,关系型,非关系型都说一下? 2、介绍一下clickhouse,为什么用它? 3、说一下简历上项目,数仓的分层架构,每一层的作用? 4、入库做数据清洗吗?还是后续在数仓中过滤?说一下实际的做法 5、数据同步是怎么做的?你在项目中的角色?(说了kafka) 6、你这个是离线的数仓吗?你觉得什么需要做数仓? 7、为什么用flinkcdc? 8、spark
前面的IEG秒挂后2天被这个部门捞了,这几天准备了下算法,但是项目有点懈怠了 时间:3月11日 14:40 ,时长45分钟 全程拷打Java项目,掺了一些业务相关的八股 拷打查询优化细节: 因为项目亮点手贱,写了用Redis缓存优化前时间、优化后时间。结果疯狂拷打怎么得出的优化时间 其实是编的数据😭😭,引以为鉴!! ⭕查询时间是怎么测出来的? 肉眼对比效果 + 查询前时间 对比 查询后时间 ❌
115、Spark的任务执行流程 driver和executor,结构式一主多从模式,driver:spark的驱动节点,用于执行spark任务中的main方法,负责实际代码的执行工作;主要负责:将代码逻辑转换为任务、在executor之间调度任务、跟踪executor的执行情况。 Executor:spark的执行节点,是jvm的一个进程,负责在spark作业中运行具体的任务,任务之间相互独立,
一面 09.05 1h多 1.自我介绍 2.实习内容 3.指标建设与数仓的对应关系 4.指标怎么管理的 5.指标报警怎么设置 6.你会怎么管理所有指标体系 7.手撕 重复字符串 二面 09.07 接近2h 1.自我介绍 2.数理知识:拉格朗日函数、贝叶斯函数的损失函数,对缺失值的影响,卡方与t与z检验的区别 3.大数据相关:mapreduce中map task与reduce task个数、hive
从今年暑期实习开始直到秋招一共五次面试,转了四个部门,记录一下 实习篇 # IEG一面4.6 自我介绍 项目用的是什么计算方案,技术组件有用到云服务吗 讲一讲你在项目中遇到的问题 项目中计算内存不足调yarn内存,为什么不是spark内存 能讲一讲spark的相关概念吗(讲了基本架构,说任务提交流程太紧张没说完) 面试官提醒讲RDD的容错机制 小表join大表怎么优化的 多小可以叫做小表 数仓当中
秋招篇 # PCG 8.24 一面 秋招并没有投腾讯,是直接被捞起来面的 自我介绍 讲实习内容 讲实习当中做的最好的工作 面试官总结了一下我刚才讲的(好像觉得做的不够难。。) 介绍spark RDD spark程序里面不写action算子,程序会执行吗(肯定的答会。。) 数据倾斜有哪几种 mysql数据库索引有哪些 数据库事务介绍 平常mysql用的多吗 有了解过doris、clickhouse这
一段大厂数开实习 感觉面试官比较喜欢有数据中台经验的 项目基本没怎么深挖 重点问了数据源的接入&处理 sql题 算科目最高分学生 java题 返回有序数组中第一次出现指定数字的位置 要求复杂度最低 #数据人的面试交流地#
一面 简历面,如果过往实习项目由机器学习等,比较关心其中数据预处理和特征处理,没有问coding和模型延伸问题(八股) 二面 对于项目中涉及的某个优化算法特别感兴趣,深挖概念、流程、优点、公式等 (第一次也是目前唯一被问到这个细节,真的要对简历熟悉) 压力大的时候喜欢干什么 hr面 为什么想来深圳 深圳还投了哪些公司 十一前发意向 总体觉得顺丰的问题难度很看分配到的面试官,和身边同学交流,有的就会
Subversion 中的分支、标记和合并 虽然很多开发团队都使用版本控制系统管理代码变更,但当多个开发人员并行地使用不同的代码库进行编码时,还是会出现问题的。在本期的 让开发自动化 中,自动化专家 Paul Duvall 展示了如何运用开源的、免费的 Subversion 版本控制系统来有效地进行标记、分支和合并。 说到源代码分支,可以将大多数的软件开发团队大致划分为两大阵营:有些是根本不分支;
主要内容:Text Sublime,Notepad++,EditPad,XAMPP&LAMPP作为一个初学者,需要了解一个网站开发者开发网站必需的一些工具,了解这些工具的主要用途。 首先,应该有一个基本的互联网包,具有良好的上传速度,最低1Mbps。 其次,应该有一台电脑与任何操作系统(可以是Linux,iOS X或Windows)。 那么硬件规格应该是最小的 - 1-2 GB的RAM,处理器至少应该是一个双核心和硬盘必须在80 GB左右。 下一步是 - 应该有一个文本编辑器,可以编写代码
做完线上笔试没几天就通知电话面试,早上八点半,hr真的很勤奋,内容如下: 解释下程序的局部性原理 进程和线程的区别 做过哪些项目,简单介绍下 接触过socket网络编程吗?了解多少?(我直接说没有过深入了解,这题就过了) 解释下linux中的块设备和字符设备? 课外写过多少行的代码? 入职后打算走C方向,还是C++方向? 最后就是经典反问了
#软件开发2024笔面经# 项目: 介绍项目,项目难点以及如何解决。 C++: 指针与引用的区别 stl库(vector…set介绍) C++11特性介绍(问了智能指针的思想) C和C++的区别 设计模式(详细讲了下单例模式) linux: IO多路复用的过程 线程池的好处 计网: TCP和UDP的区别 OSI七层模型介绍 操作系统: 就问了进程和线程的区别😂 数据库: B+树相比B树优点 索引
我在这个问题上寻求帮助,但发现这些类型的打印机的打印标准是使用POS for.NET。问题是,这现在有点过时,或者至少几年来没有任何更新。关于如何使用这个库,有很多问题被问到,大多数答案都不太容易理解。因此,如果有人能在收据打印机上提供一个简单的短语(“Hello World”)打印方面的一步一步的帮助,我将非常感激。 我使用的是运行在64位Windows7上的visual Studio2012,
时长:28min 1、自我介绍(说了实习期间做的工作,主要是做数仓) 2、面试官拿着简历开始问,问着问着我发现不对劲, 我:“您好,您是不是拿错简历了?”, 面试:“你不是XXX吗?” 我:“不是” 面试官:“稍等,我找一下,你继续说你的”。(我又把做了一遍自我介绍) 3、你说一下你在实习期间做的工作。。。(又说了一遍实习工作) 4、你说的都是业务上的问题,有没有技