15min 八股 + 50min 手撕代码 八股: 如何判断java对象可以被回收 手撕:1、LRU缓存 2、mysql mysql主播表: 用户id,房间id,开播时间,下播时间,房间开启状态(0、1),日期 第一问:求每个主播每一天的开播时长 第二问:求每个主播一天内每小时的开播时长 没想到主播可以跨天直播,寄! 本java后端菜鸡,被大数据开发爆杀😂
介绍项目,细问了一些项目中的知识点 spark RDD宽窄依赖 sql编程汇率换算 python二维数组查找数据 mysql hbase比较 hbase行列存储 mysql能否直接查数据中某一列的特定数据,hbase能不能(这块问的我没太听明白) mysql两种表引擎 对事务有什么理解,举个例子 大数据协同算法,保持一致性举几个算法例子 有什么要反问的 大概就是这些问题可能差一两道忘了,hbase
1.自我介绍 2.实习经历,具体做什么,扣简历细节 3.两道SQL题,求各个渠道第一名,还有一个想不起来了 4.反问岗位日常工作,大数据架构及原因,对于SQL优化的要求,百度drios和Apache presto的区别 第二天,HR说leader很有意愿,让我马上过去offer已发 为什么就一面,我还准备三战滴滴
1.自我介绍 2.项目介绍 3.MapReduce揪着排序问 Spark揪着OOM问题问 hr和技术一起面,总共20min
目前去团子了。总结一下一个多月以来找实习的历程,也算是非常坎坷了,好在最后结果还行,最后说一句我是团孝子 #暑假实习# #美团# #大数据开发#
7.15一面: 1.自我介绍 2.项目深挖(聊了很久) 3.对数仓的看法 4.主题域及其建设过程(要落地,谈业务过程) 5.讲一个熟悉的指标体系构建(没做过) 6.为什么不考研 7.为什么想跳槽 8.sql留存率(讲了下思路就行了) 反问: 1.为啥晚上6点还面试,唯品会不是955吗 2.唯品会的计算引擎选型是什么 ------------------------- 挂了
1.问本科经历,对大数据的接触 2.问项目是否是真实项目或者实习项目,,不是demo 3.项目介绍,毕设项目讲了15分钟 4.where和having区别(having能单用) 5.Spark宽窄依赖 6.leftrightinnerjoin 7.sql写题,统计所有月销售额超过1w的员工 8.反问,ABtesting--是否是埋点-PVUV-灰度策略的流程
Kubernetes community中已经有了一个Big data SIG,大家可以通过这个SIG了解kubernetes结合大数据的应用。 在Swarm、Mesos、kubernetes这三种流行的容器编排调度架构中,Mesos对于大数据应用支持是最好的,spark原生就是运行在mesos上的,当然也可以容器化运行在kubernetes上。当前在kubernetes上运行大数据应用主要是sp
45min 自我介绍 数仓项目的数据采集模块怎么做的 flume组成,各个模块的功能 为什么要使用这些source或者是sink file channel和memory channel有什么区别,分别在什么场景使用 flume内部原理 sink消费能力弱,channel会不会丢失数据 数千台机器需要采集日志小文件到hdfs上,该怎么办? 数千个flume要怎么统一配置,修改就分发吗? maxwel
投nlp挂,转岗大数据开发 一面 算法题:一个只包含1,2,3的数组,排序使得3在最前,2在中间,1在最后。要求时间复杂度O(n),空间复杂度O(1)。 用双指针,类似快排的思路。 二面 算法题:数组中,第一个非0的数位置索引,时间复杂度O(log n)。 二分查找。 两个面试官都很nice,没有因为岗位不匹配为难。#我的秋招日记#
2022-8-9 下午两点十八 HR面 1 自我介绍 2 实验室研究方向 3 成绩排名 4 比赛 6 7 8 9.... 2-3周会通知结果 offer得等研究院开放 #大华提前批##面经#
5/5一面 5/14 二面 5/18 hr面 5/19 OC 一面(1h10min) 1.自我介绍一下 2.介绍一下你的项目 2.1 Mysql全量数据规模 2.2 既然Mysql能存储,为什么要导入到hive中 3.说一下MySQL的ACID特性 4.脏读和幻读分别是什么含义 5.spark持久化的级别和作用 6.spark任务出现数据倾斜有哪些方法解决 7.hive没办法创建分区怎么理
大概是今年五月初面试了荣耀大数据的Java开发港,面试官全程基本什么都没有问。也没有问一些八股文的问题,也没有问算法题。 就是轻蔑地看了一眼我的简历,然后问你的项目是自己做的,还是根据别人的来做的,然后直接说你做的这个项目怎么这么简单,因为我还有一个机器学习的项目,然后他就随便问了项目做什么的。 最离谱的是他说你有机器学习的经历,那么我推荐你去客户端。 总之全程什么技术问题都没有问你,也没有问项目
部门:网易云 8.23约面,8.25 一面 8.29 二面。8.30 hr面 一面: 45min左右 1.自我介绍 2.说说项目用到了哪些技术 3.你刚刚说到了即席查询,项目里是怎么做的。 4.四道sql,十分钟后对答案 5.笛卡尔积了解吗。 6.笛卡尔积会产生什么问题。 7.你刚刚说到了数据倾斜。介绍一下。 8.笛卡尔积就会产生数据倾斜吗 9.mr流程介绍一下 10.你多久能来实习 11.你刚刚
🍆 数仓方向 9.19 一面 第二天就挂了 自我介绍,科研项目介绍(项目相关问题提问) 1) 内部表和外部表的区别? 2) 窗口函数? 3) 知不知道比HDFS活跃度更高的产品? 4) Zookeeper常用得场景和用法?RATF协议了解吗? 5) CAP原理?一致性的概念? 6) Hadoop如何保证一致性? 7) Hadoop生态圈和MySQL等分布式数据库的区别? 8) Hive支