做题:前缀树 自我介绍 为什么想要开现在公司,找工作;为什么选择我们,小创业公司? 介绍简历上第一个项目 移动语义 表达式值类别:左值 右值,泛左值,将亡值,纯右值 智能指针实现shared_ptr,unique_ptr 实现3个线程交替打印ABC,给出伪代码 mysql的事务隔离级别,读取未提交,读取已提交,可重复读分别解决了什么并发事务的什么问题 mysql有哪些锁 知道mysql的buffe
1.sqoop底层是怎么实现的 2.shuffle调优 3.数仓和数据集市的概念 4.数仓分层,各个层是做什么的 5.维度退化,为什么要维度退化 6.HDFS上文件用什么存储的,ORC底层是什么样的 7.sql,求TopN 8.从一个数组中求第N大的数(先手撕了一下快排,然后面试官问有没有更好的答案,然后说了一下用堆的做法) 反问 整体面试三十分钟左右,感觉是寄了
1.自我介绍 2.rdd变dataframe,再变dataset中间发生的过程 3.项目拷打 4.说说文本处理方法 5.说说数据采集经历 6.颜色分类,操这题还没写对,麻了
已经入职一个多月了,才想起来写篇面经,有些面试细节记得不太清楚了,大家仅供参考。总体来说面试体验挺好,问的问题也没有很刁钻(可能是急缺人手),废话不多说直接上干货 一面 1. 自我介绍 2. 项目介绍-主要关于我在美团实习做的项目,AB实验,如何确保用户画像相似,观察的核心指标等等 3. t检验和z检验 4. p值的意义 5. sql:求用户留存 6. 逻辑回归背后的核心原理 7. 随即森林和xg
1.英文自我介绍 2.git rebase怎么使用 3.编程题 sql窗口函数 python二分查找 4.衡量点击率如何做AB测试(非常详细,包括原理公式等,例如二项分布方差) 5.智力题 可以百度傻子坐飞机 年前机会好少,好久没面试了,重新开始复习顺便准备下后面的春招了 #实习#
1. 自我介绍 2. 科大讯飞比赛做了什么,是用到了讯飞平台的某些功能吗 3. API开放平台详细介绍一下 4. 但是你做的这个接口调用具体收益,作用是干嘛的呢 5. 接口调用高并发情况时用户使用延迟之间如何进行优化 6. 用户访问时的延迟黑洞是什么,如何优化 7. 软引用、弱引用分别是什么 8. 如何提升系统的处理能力,如何优化 9. 手撕: 1. 多线程去查询数据库,并将查询结果放入List<
岗位JD 使用大数据组件对海量数据进行建模,参与数据仓库的的开发、维护及优化 岗位要求 计算机相关专业,对大数据有浓烈的兴趣 扎实的计算机基础,熟练使用python/java/scala其中至少一种语言 熟悉Hadoop生态体系,包括但不限于Hadoop/Hive/Spark/Clickhouse 学习能力强,强烈的责任心,具有较强的沟通能力及团队合作精神,细致耐心、积极主动 有大规模数据/日志处
base深圳,要求全勤实习6个月以上,问了一下HR,一面是30min,一共有两面 自我介绍 拷打之前的实习(主要是做ETL开发),包括但不限于工作背景、工作意义、指标异常处理、异常来源分析、大规模数据处理方式和逻辑。 对数仓理论的理解 数据仓库的分层,每层是干什么的 介绍一下你对数据库和数据仓库的理解 怎么理解根据不同的任务背景,对数据仓库进行技术选型和设计 sql题:找出连续3天登录的用户 对区
金九银十铜十一摆烂十二,想想还是给自己秋招画个总结句号 bg:中流985+港三硕,5段非大厂数分实习,无科研无奖 找工作方向:数据分析师/数据挖掘师/产品经理 timeline:8月开始,9月爆满,10月爆满,11月零零散散,12月收尾 offer:pingan、蚂蚁金服、PDD、oppo、SF、淘天 数分的薪资基本上比较接近,薪资范围在n*15——(n+5)*15,有烂大白菜也有大sp,越晚拿到
Timeline: 10.19 投递 11.10 笔试 11.28 技术 主管 HR面 1.10 OC 1.实习经历 2.主实时还是离线 3.hdfs命令 4.数仓分层 5.数仓建模 6.数据采集方案 7.数据倾斜 怎么解决 8.调度运行过慢怎么解决 9.数据有错怎么排查 10.处理过一整条数据链路吗 11.可视化 12.flinkcdc读取数据漏数据怎么处理 13.flink流批一体 14.竞赛
问题: 自我介绍 优缺点 别人怎么评价你 转向数据分析的契机 实习和竞赛哪个更印象深刻 实习中遇到的困难和解决的方法 对岗位的期待 反问 会不会影响学业 到岗时间 非常快,加起来20分钟
手撕一个快排 问了一些系统优化解决方案(如何增加访问量、加快请求处理速度):我回答了数据库方面、缓存方面、接口优化、最后就是微服务分布式系统(比如在不同地域都设置机房,处理不同地域的用户请求)。 问了一个软引用、弱引用(回答不完整,忘了好多,我无语了哈哈哈哈) 反问了一下表现:java知识可能有点欠缺(因为软引用和弱应用没有完整答出来)。代码能力还可以(10分钟不到直接在idea写出来了)。系统方
问题: 自我介绍 简历上指标选取原则 优缺点 对实习的期待 常用的sql聚合函数 项目落地的措施和策略 怎么保证数据的准确性 非常轻松愉悦的一次面试 期待二面
1、上一份实习了4个月之后为什么不继续实习了? 2、我看你上一份实习主要是做机器学习是吧?你机器学习使用的是什么模型? (1)具体调用哪些算法你有研究过吗? (2)你的这个项目主要是做什么工作? (3)是不是大概就是从数据库拿数据,然后对数据进行清洗,然后在进行自动化调度、自动化训练对吧? (4)你数据库拿数据是使用sql拿吗,还是使用Python拿? (5)mysql和heidisql的区别是什
一面 12月28日 15:00 1h 了解分布式吗,看过哪些相关的分布式数据库和知识 看过哪些论文 深挖minisql项目 2PL 脏读,幻读,不可重复读 这个项目是怎么实现的,从0到1吗,介绍一下实现的过程 支持哪些SQL数据类型 日志系统的设计(支持哪些日志格式) 如果用户写入一个大的blob日志怎么处理 fsync怎么处理的 redo log在commit之前还是之后处理的 是否有丢失数据的