一面前还有笔试 两道算法题挺简单 本来以为进去要转c++的 在自我介绍阶段就没怎么聊java 都在说自己不怎么会c++ 结果最后反问才知道原来是分布式数据库 java是作为计算层的主要实现语言 怪不得这面试官这么了解java 1. jvm调优 有啥常见参数 2. 常见设计模式 3. docker如何打包镜像 4. mmap系统调用 然后基本上都在问项目 面试官对电商业务好像还挺了解 聊了大概35分
简单介绍一下项目 项目里一些点随便聊了一下 没问几个问题 算法 实现一个HashMap 问了面试官是要拉链法还是可以用最简单的开放寻址 回答都可以 然后我就整了个开放寻址 随便写了个测试样例没出啥问题就过了 总时长30min
面试时间:50min 自我介绍 实习内容 工作部门是数据中台,数据中台是什么?和数据仓库有什么区别? 项目用什么采集数据?原理?还了解过其他采集工具吗? 对数仓分层的理解? 你们是按什么标准分主题的?用的什么数仓模型? MR的工作流程? Spark原理?和MR的区别? RDD依赖关系? Job、stage、task划分? Hive介绍,原理?Hsql转换到MR的过程? Hive的文件存储格式? 知
一个小姐姐打电话告诉我会议号的。 进去之后,先自我介绍,然后让我讲项目。 hdfs的读写机制 雪花模型星型模型的区别和适用场景 小文件的弊端 又在问项目 20分钟结束了,反问环节都没有。。。
来源:http://www.techug.com/full-stack-python 前段时间,ThoughtWorks 在深圳举办一次社区活动上,有一个演讲主题叫做“Fullstack JavaScript”,是关于用 JavaScript 进行前端、服务器端,甚至数据库(MongoDB)开发,一个 Web 应用开发人员,只需要学会一门语言,就可以实现整个应用。 受此启发,我发现 Python
前言 从2023年3月初开始投递暑期实习,几乎所有大厂都投递过了,有些简历都过不了,有些一面直接挂了,虽然说确实互联网行情不是特别的好,但是应该还是自己能力不足,做的简历不够漂亮; 4月的时候第一次刷到了@三石数据的面经帖(见下图),于是跟他聊了一下,真的收获太多了,非常非常感谢这位大佬的指导,不仅帮助我修改简历,而且还给我解答一些在面试中遇到的问题;大佬要是没女朋友的话,我愿意以身相许(开个玩笑
更新啦 10.13 上午 突然打电话hr面 1.自我介绍 2.介绍项目 3.做项目有什么收获,是实际开发的项目还是练手的 4.科研项目是自己完成的,还是和别人一起完成的 5.未来的职业规划,工作地点 6.家庭情况 7.期望薪资 大概就是这些啦,就是随便聊聊,大概十几分钟的样子,最后面试官说因为最近刚刚开始线上面试,人比较多,所以不好说什么时候会有结果,可能需要等一等 10.10收到一面邮件 10.
面试10分钟不到,等了快半小时 1 自我介绍 2 项目介绍 3 hdfs读数据流程 4 linux vim命令 5 热门商品topN指标编写 6 为什么选择西安 7 期望薪资
ORC 和 Parquet 文件格式的优劣势和区别? ORC(Optimized Row Columnar)和Parquet都是列式存储格式,它们在大数据处理领域,特别是在Hadoop和Spark生态系统中,被广泛使用。以下是ORC和Parquet的主要优劣势及其之间的区别: 设计背景: ORC:主要为Hadoop生态系统中的Hive而设计。 Parquet:是由Apache Arrow项目的一部
字节商业化技术大数据一面45min 自我介绍; 介绍熟悉的项目,说了数仓项目,重点问了分层中的DWB层数据降维;DWS层中的事实表; MR流程; spark为什么比mr块; sparksql执行流程; 缓慢变化维; sql部分最高薪资员工; sql用户最高连胜次数; 实习时间; 是否准备秋招??? 反问
个人情况简述:本硕双非,acm银牌 群友(cpp实习生)内推投递 因为是之前面的,时间也有1个多月了,可能记不太清一些细节了 一面(总时长90分钟) 聊简历项目,一个离线大数据处理项目,flume+hadoop+hive+spark+azkaban,两个后端项目 项目扣细节,主要问设计思路,比如数仓各层的设计、flume和kafka之间如何结合使用,spark的算子等 项目一共问了40多分钟 接下
1.问项目 2.数据倾斜,spark,hive,问的比较多。大多是简单的八股 3.问java很多(没复习,哭死) ①java的多态是怎么实现的、 ②java泛型了解吗 ③java反射了解吗 ④java垃圾清理机制是什么 ⑤java多线程了解吗 直接一问三不知 4.sql现场写代码
数据开发-电梯数据开发举例 离线数据开发 实时数据开发 数据开发-电梯数据开发举例 更新时间:2018-02-01 21:17:58 假设电梯设备,每天都会定时上传数据,每台电梯每隔1分钟会上传一次数据,包括电梯id,运行状态(上行,下行,停止),门状态(打开,关闭),数据会进入离线表和实时的METAQ。 离线数据开发 业务需求:电梯利用率情况(某个单位的电梯在某个小时段内利用率,可以减少这个单位
一面-单面30min-0914 开头挖简历 1.自我介绍 2.挑选简历里一段具体的经历,说说自己怎么抓热点的,怎么应用到产品中去的,应用后怎么检测效果的 针对搜索产品运营岗位本身: 基础题: 1.有使用过今日头条/抖音吗? 2.你觉得吸引你使用这些软件(自己常用的)APP的原因是? 3.如何给B站想要改进热点这一块的板块内容,你会怎么做? 4.现在一般的搜索软件都是搜完后直接出结果的,你觉得这种搜
25min 1.自我介绍 2.讲一下本科专业和研究生专业,分别学了啥 3.讲项目 4.Java主流框架讲一下 5.两个项目讲一下,团队怎么分工的,有没有移动端用户使用 6.对宁德时代的看法 7.讲专利,的创新点 8.个人优缺点 9.职业规划 10.反问 #宁德时代#