自我介绍 聊实习 聊实验室项目 怎么分析一个程序的瓶颈 IO多路复用 场景题:多线程客户端可以使用一个socket吗?怎么保证线程得到想要的数据 c++怎么禁用拷贝构造 c++怎么实现单例模式(静态局部变量,双重加锁检查) 加单个锁可以吗(可以,但是影响效率) 算法: 数组中的数代表能走的步数,能否到达尾部 写一个LRU缓存 把LRU缓存改成线程安全
快手秋招数分一面 总共60分钟 1.谈谈树模型 2.SQL留存率 3.时间序列常用模型,具体步骤 4.概率题,两个孩子其中一个女孩另一个也是女孩的概率 5.深挖简历项目 6.拆分指标 总播放时长下降 7.因果分析和相关分析 8.滴滴火车站附近供大于求怎么优化(局部最优和全局最优) 9.全北京市的圆井盖和方井盖的比例和数据 10.假设检验的p值和显著性水平 11反问 #快手面试##数据分析#
#秋招# #数据分析# 1.深挖实习经历,重点讲了一个数据埋点的,没怎么给压力,主要就问了下跟开发,业务对接时出现了哪些问题,然后怎么解决的 2.问了下实习中碰到的归因、异动分析,没啥这样的经历,所以很快跳过 3.短视频相关的异动分析,这个没啥,按着异动分析的逻辑来就行 4.留存率sql,这个也比较基础,很快过 5.时间序列和回归的区别,这个答的很烂,之前好像准备过差不多的,但是太久没准备面试了,
一面 8.31 面试官小姐姐很好,但是面试只有24min,但是我又感觉不咋像kpi 1.自我介绍 2.问项目 3.求用户视频耗时最长的三个垂类的SQL题 4.APP用户总的使用时间/DAU,这个指标下降了怎么分析 5.问了个关于我实习的问题 约二面了 二面 9.4 #双非# #面经# #快手#
面了快二十次了,从没有见过压迫力这么强的面试官,压力爆大,寄。 面试一共30多分钟,无手撕,感觉面试官不是很想面了。 先介绍自己,没让我介绍项目。 1.开篇很美好,问了hive内部表和外部表的区别。 2.问有没有遇见数据倾斜的问题。宽表建设的时候遇见过。 3.怎么解决。使用map join。 4.map join是什么。大表join小表,小表加载内存里面,map端实现join无需reduce。 5
40min 自我介绍 看到主要研究是在算法上,只是想要算法的工作还是数据分析相关的岗位也可以呢? 投递的论文的刊物的等级 试验班的是怎么选拔的?所学的基础知识课程相同吗? 详细介绍一下项目? (对项目中一些存在的问题提出疑问) 在项目中,运用了聚类的方式,讲一下具体是怎么聚类的 聚类算法简单介绍一下 科研项目的代码量 评价一下自己的代码能力,和工程性很强的男孩子比你觉得你的代码能力怎么样? 项目介
20220928杭州银行数据研发岗一面 写在前面:等了半个小时才进,在这里记录下流程 面试流程 自我介绍 两个面试官,第一个因该是数仓方向,第二个因该是大数据平台开发方向 数仓方向先问的,问知不知道TCP,问三次挥手为什么有三次 问get和post的区别 问知不知道数仓,说大概知道 问知不知道自然键,然后我说没有了解过这个概念 大数据平台开发方向继续问 问spark任务提交的流程 问RDD概念 问
3月1日晚笔试了2小时,我对Hadoop不甚了解,同时编程第一题暴力求解花费太多时间导致动态规划没有完成,寄 单选题10道,考察计算机网络、JAVA、Hadoop、MySQL等计算机基础知识 简答题3道,考察MySQL索引和优化、Hadoop大数据组件、对游戏指标的解读 编程题3道,一道Z字型变换(参考力扣第6题N字型变换),一道合并区间(力扣第56题),一道动态规划,都是中等难度 主观题2道,了
一面 1.自我介绍 2.最好的项目 3.数据可视化 4.research和find 5.try except 6.数仓的架构 二面 1.自我介绍 2.如何处理异常值和缺失值 3.numpy和pandas平时怎么用于数据预处理 4. pyspark怎么处理缺失值
第一次写没啥经验,但是遇到的面试官很好,全程给我提示告诉我应该重点学什么东西,最后反问环节也就问了数据研发具体的工作内容,没好意思问他我的表现如何,因为我的表现巨差😭 问题 问我简历上实习做的哪些项目 根据我的实习认为去我数据分析岗位更好 数据研发和数据分析的区别 了解数据研发需要哪些组件 hivesql语句底层的转化 hivesql的底层是怎么进行自动优化的? hive的数据倾斜 hive中计
一面8.23 1.自我介绍 2.介绍一下你做过的项目 3.从项目展开的问题:sqoop导数据是从哪到哪? 从mysql到hdfs 在导数据的过程中有没有遇到什么问题? 数据量不大,所以没什么问题 (我的项目很简单,所以我没法答啊,不过幸亏面试官没有深究,开始八股) 4.范式建模有什么特点?和维度模型的区别 (数仓建模理论在《大数据之路:阿里巴巴大数据实践》中有详细归纳,强推!) 5.三范式能说出来
一面 redis: RDB和AOF的区别 AOF中记录的是什么,RDB中记录了什么 过期数据的删除策略 使用这些删除策略可能会出现哪些问题 定期删除是所有数据删除吗 内存淘汰机制 allkeys详细说说 redis使用场景 redis和memcached有什么区别 为什么用单线程不用多线程 clickhouse(实习里用的主要是这个): 简单介绍一下clickhouse,说说为什么用这个 说一下R
1、上一份实习了4个月之后为什么不继续实习了? 2、我看你上一份实习主要是做机器学习是吧?你机器学习使用的是什么模型? (1)具体调用哪些算法你有研究过吗? (2)你的这个项目主要是做什么工作? (3)是不是大概就是从数据库拿数据,然后对数据进行清洗,然后在进行自动化调度、自动化训练对吧? (4)你数据库拿数据是使用sql拿吗,还是使用Python拿? (5)mysql和heidisql的区别是什
问项目内部实现细节 手写 快速排序 如何实现memcpy?常规的思路有什么问题(从头开始复制) 如何解决? 答案:从后面往前面的顺序复制数据 c++ forward 作用 c++ move 作用 举例子 对智能指针的理解 重点讲讲shared_ptr weak_ptr之间的关系 手撕算法:leetcode 739 每日气温 用单调栈解决
1.问问项目(10分钟左右) 2.问了MySQL,Redis一些简单的问题,MySQL的MVCC,索引;Redis缓存击穿(5分钟) 3.算法一:反转链表 算法二:最长的连续子序列(没做优化,在面试官提醒下做出来的) 感觉一面的难度很低,问的八股也很浅,主要是考你算法能力吧。#面经#