一面 50分钟 自我介绍 你学过的大数据掌握的最好的是哪一个 hive里面排序一般怎么使用的 hive内部表和外部表的区别,外部表在什么场景下使用 hive视图用过吗 你对维度和事实的理解 你说到了业务过程,谈谈对它的理解 你刚刚描述的是一个业务过程还是 多个业务过程 多个业务过程放到一张事实表的你举个例子 维度建模中 星型模型和雪花模型 之间的区别 缓慢变化维表如何处理呢 全量表的数据保存多久
字节整体给我的感觉是不怎么问八股,他们非常想听你的理解是什么,问的很多问题网上都没有答案,高度都很高。 一面(2023.3.22) 自我介绍 为什么选择从全栈开发转到大数据,为什么会对大数据感兴趣 有学习过大数据的一些技术栈或者项目实战么 狂问项目(国电的,问的极其极其细) 问了电商数仓项目(大概介绍了一下维度建模) DWS层都是什么类型的事实表(不知道怎么答,感觉问的很奇怪,就直接答了事务型事实
一面 12月28日 15:00 1h 了解分布式吗,看过哪些相关的分布式数据库和知识 看过哪些论文 深挖minisql项目 2PL 脏读,幻读,不可重复读 这个项目是怎么实现的,从0到1吗,介绍一下实现的过程 支持哪些SQL数据类型 日志系统的设计(支持哪些日志格式) 如果用户写入一个大的blob日志怎么处理 fsync怎么处理的 redo log在commit之前还是之后处理的 是否有丢失数据的
### 一面技术面 自我介绍 四道算法 前两题是sql,其中一个难点的就是求连续登录2天以上的用户 一道快排 一道求二叉树是否是对称二叉树,就是左右节点是对称的 问实习经历(问的很细) 工作中的难点 维度建模过程 聊到数据仓库工具箱这本书的内容,我都不会。。。 数据倾斜(我从原理,场景,解决方案三个角度回答的) 问到一些常用函数,UDF,UDAF,UDTF概念 hive的概述 hadoop,hiv
一面 8.15 45min 0. 现在状况,职业规划 1. 问简历上数据建模的项目 2. 你的理解数据建模应该怎么进行 3. 了解数据库事务吗 4. 主键和唯一索引知道吗 5. 用过hive吗,数据倾斜怎么回事 6. 数据结构/算法怎么样?了解排序吗?哪几种排序?稳定性问题? 7. 编程题 python 给有3个或更多个数的数组,返回最大能组成三角形的周长 8. sql题 简单的group by
视频ms 前三分钟 自我介绍 数据仓库的了解 怎样设计数据分层 了解的大数据组件 spark用于解决什么问题 spark底层逻辑 sql的join实现方式 举例A(3) join B (5) 有几条数据 join底层逻辑 sql题 查询用户峰值 全程不到30分钟 **我就是一个小菜鸡。问就是面试凉凉 问的其实感觉没有特别难 但就是啥都不会。还是学的太过浅层次。总的来说 项目拷打 底层深挖。G
投递时间:9.25 面试1v1 1、自我介绍 2、测开都做什么 3、自动测试开发你做了什么内容 4、用非侵入式的测试方法(cv)和侵入式的方法(调API)有什么优缺点 5、python的装饰器 6、linux常用命令 8、c++重载、重写、覆盖 9、c++的析构函数什么时候调用 10、进程和线程的区别 11、http状态码5开头是什么 12、手撕,两数之差 反问:面试整体流程多久 该岗位主要职责
八股 1、lamda表达式的实现原理 2、C++智能指针 3、C++多线程 4、OSI模型与TCP/IP模型,及各层简介 5、数据传输到网络层之后是什么样的? 真的,我尼玛,好难啊! 算法 1、一个序列中元素两两连续出现,找出落单的元素(下标) eg.2 2 1 1 3 4 4 -->3 最优:O(logn) 二分查找:序列的数量是奇数,二分之后,前半部分偶数,后半部分奇数。如果前半最后一个元素和
字节: 1.项目介绍 2.java的容器有哪些,说说map类型的数据结构除了hashmap,如果想要有序遍历map可以如何使用,采用那种数据结构,问hashtable是怎么保证线程安全的,加的锁属于什么锁,这个锁封锁粒度是多少 3.谈谈redis索引,B+数据结构为什么用于索引,不用红黑树,如果让你查询你觉得查询次数两种数据结构次数是不是相同 4.redis支持的数据类型,说说zset的底层数据结
背景:2本非科班+211科班 项目:一个导师项目、一个尚硅谷的项目 Java技术栈,部门是C++ 前面都是随便问问,13花了很长的时间,14也花了一点时间 0、自我介绍 1、Java的基础数据类型和占用内存 2、int在不同平台占得内存是一样的吗 3、JVM是什么 4、class文件存一些什么 5、为什么要重新编译成class文件,class会存一些什么 6、加载class的过程 7、运行一个程序
1.自我介绍 2.解释数据库,表,索引 3.索引一遍加在哪里 4.问索引为什么能加快查找速度 5.解释第三范式 6.出了七八道走不走索引的判断题,解释理由(有个范围查找的走没走索引答错了,呜呜呜呜) 7.解释二叉树 8.问二叉树的几种遍历方式 9.算法题,问二叉树存不存在根节点到叶子结点路径上的数据和为一个target。 反问,问了部门业务场景,还稍微聊了一点数仓的东西。 12.16update,
第一次发帖,说一下字节测开三面吧,感觉很不好,问的有点难,最后题都没做就结束了。 首先介绍一下自己,包括学了哪些课程。 然后开始问八股 路由协议有哪些。OSPF怎么获得链路状态的,怎么决定路由的。(不知道) ARP是什么,ARP攻击有哪些。ARP***怎么工作的(不知道)。 NAT网关是什么,作用。 还有linux命令。 怎么使用linux命令获取top第三行第四列的结果(不会) linux一条命
这轮比较关注底层 1.自我介绍 2.个人信息和实习时长进一步沟通 3.问项目,进一步阐明下项目细节 4.HDFS备份文件数量 5.HDFS读文件底层原理 6.HDFS写文件底层原理 7.追问是写完一个文件就返回还是所有备份写完才返回 8.问MapReduce原理 9.问Hive内部表和外部表的区别 10.问Hivesql咋转换到MapReduce的 11.问Hive可以用啥作为元数据库 12.Hi
1.问本科经历,对大数据的接触 2.问项目是否是真实项目或者实习项目,,不是demo 3.项目介绍,毕设项目讲了15分钟 4.where和having区别(having能单用) 5.Spark宽窄依赖 6.leftrightinnerjoin 7.sql写题,统计所有月销售额超过1w的员工 8.反问,ABtesting--是否是埋点-PVUV-灰度策略的流程
15min 八股 + 50min 手撕代码 八股: 如何判断java对象可以被回收 手撕:1、LRU缓存 2、mysql mysql主播表: 用户id,房间id,开播时间,下播时间,房间开启状态(0、1),日期 第一问:求每个主播每一天的开播时长 第二问:求每个主播一天内每小时的开播时长 没想到主播可以跨天直播,寄! 本java后端菜鸡,被大数据开发爆杀😂