JAVA源码 HASHMAP底层机制 TCP的细节,怎么建立连接的,拥塞控制,流量控制的区别 MySQL MVCC机制,事务隔离级别,幻读 JVM的垃圾回收,全过程,新生代,老年代,balabala的细节 进程间通信 .写一道算法题,贪心,应该是leetcode原题 一个简单的动态规划#字节跳动实习生招聘##后端开发话题##面经交流#
今天上午刚刚面完强生医疗产品研发群面。10个人里5个留英/美学生,另外几个全是名校,例如西交同济啥啥。 流程:英文自我介绍,中文案例阅读,中文讨论,英文总结,面试官提问,英文反思。 这次我面的感觉实在是不咋滴(我不咋滴) 几个建议:1注意卡时间,要注意好时间的分配,最好不要超时 2注意人员的分工,要有人注意记时间,有人进行各位同学叙述内容的记录,还要有人把话题拉回正轨,3如果你觉得大家讨论偏了,就
6.30一面 面试官很nice 1专业相关 为什么要跨专业考研 具体的专业在实际中的应用 2 问了个简单的sql 写错了 面试官一步步提醒终于写出来了 3 口述用栈 实现计算器功能 7.1 二面 1 简单sql 2 数仓理论 3 数据倾斜处理 滴滴面试官都是很有耐心 一步步提示你 解决问题 就算面不过体验也很不错。 7.11收到offer了
阿里 数据研发 8月底 一面 9月中 二面 30-40min,面试内容都差不多 大数据:hadoop了解多少?讲讲mapreduce,其中有几次排序?hive?hive调优? 数据仓库:星型,雪花,星座模型;数据分层 -- ODS,DWD,ADS,作用(我回答承上启下) 手撕SQL:窗口函数,查找连续三天的记录 等等数据仓库和大数据的问题 开放性问题:服装厂秋季生产什么样子的衣服? 实习经历,内容
1h10 min 面试官是个大佬,全程面试偏场景题 八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件 场景题: 快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播 有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决 雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用
阿里云: 1.EXCEPTION和Error的区别,可以抛出自制的Error嘛,会被捕获嘛(都实现自Throwable) 2.HashMap可以保存null key或者value嘛, 3.ConcurrentHashMap可以存null嘛,为什么不可以 原因:设计者的设计问题,以及二义性 4.Spring中事务的隔离传播方式默认为? 5.两个事务中,一个事务A调用事务B,此时B回滚了,A会不会回
1. 匿名面试,首先是自我介绍。 2. 项目问题 * Redis 的模式 * 有了Redis 为什么还要有 MySQL 3. C++知识 * 两个C++小例子,问输出(如图) * 虚函数的底层原理 * 哪些函数不能被用作虚函数 * 构造函数可以用作虚函数吗 * 什么情况下会有野指针的情况发生 * define 和 inline 的区别 * map和unordered_map的区别 * map中如何
30min 问简历 快速排序 场景题:十亿个数怎么排序,十亿个double需要多少内存(算成GB,1亿个数怎么排序 研究生方向和项目 反问:今年招的人多不多。-不多,今年看到的简历是过去五年最好的(我人麻了 主要工作内容。-数仓搭建,开发相关,数据分析相关
🤔面试感受还不错,两位面试官很和蔼,但是自己表现得一般,全程围绕项目问问题,没问太多八股。 1、自我介绍 2、问了科研方向,扯了三四分钟 3、问项目功能、技术栈 4、索引不命中的情况(不会,扯了索引失效) 5、项目里用到的索引 6、redis可以存储不同结构的数据吗 其他的都是一些项目里的场景,还延伸了场景问我应该怎么实现 基本上除了项目怎么实现都没太答出来,要么就是说错,唯一的安慰就是多少都能
一面:投的数研,实际数科 1.自我介绍 2.实习内容 3.实习团队架构 4.map reduce原理 5.数据倾斜有没有遇到过?怎么解决 6.ab实验原理、流程、如何分析 7.假设检验原理 8.口述sql题目:求连续登陆三天的用户 9.假设检验概率论场景题:求置信区间 10.常用的机器学习算法 11.随机森林原理 12.求职意向,数科还是数研,安排下一轮面试官(回数研后第二天结束流程) 13.反问
一面 常见数据结构 维度建模 事实表建模 工作中维度建模是怎么处理 三种事实表的区别 mapreduce原理 hdfs读写流程 增大资源是否会有限制 是否遇到过数据倾斜 二面 数据倾斜 数据治理怎么做的 职业规划 爱好 三面 主题域 数仓建模 bucket join
一面 1.自我介绍? 2.为什么从数分做数开? 3.你觉得数分和数开有什么区别? 4.spark和hadoop哪段实习接触的? 5.讲一下mr和hive原理? 6.hdfs中,一个block大小和通常配置个数? 7.用spark还是用hive?spark比hive好在哪里? 8.spark既然是基于内存的,那么内存不够怎么办? 9.数据倾斜? 10.uid粒度和did粒度用在AB不同的场景是指什么
9.4 一面 1. 介绍实习经历 2. 数据同步 3. 指标分层 4. flink:状态,历史数据回溯、一致性保障、barrier下发、开始做ck的时间点、反压、下游怎么知道上游反压了、解决 5. hbase问题:架构、数据读写、底层文件存储、region划分、regionserver划分(这是啥) 6. jvm内存管理,多线程 7. spark问题:宽窄依赖,算子,shuffle,调优 8. 数
一面 数据同步怎么做的 事实表、维度表怎么设计 数据完整性、唯一性怎么保证 数据怎么分区,如果增量同步,需要历史数据合并分区慢怎么解决 数仓如何进行组件选型,理由 数仓建设过程中有哪些难点 atlas如何获取数据血缘 拉链表怎么设计 你觉得拉链表常用吗,为什么不用 那你为什么要设计拉链表 sql题 分组topn row_number rank dense_rank区别 看两个sql,差异在哪,哪个
技术面 之前挂的流程都没了,捞起来又面 1.自我介绍 2.介绍项目 3.项目中遇到的问题,如何解决 4.跨域问题 5.http状态码 6.Nginx配置的内容 7.Vue的路由模式 8.Flex布局 9. Promise,async/await理解 10.ES6新特性 11.箭头函数的优点 12.JavaScript改变this指向的方法 13.手写bind方法 14.手撕反转链表 #2024#