摘要 数据工程的全流程(数仓建设-数据接入-数据运维-数据分析-数据挖掘)的各个阶段都有涉及... 自我介绍,问了我在百度和蔚来做的工作(数仓),对简历项目中对数据倾斜的发现、解决方法和效果 回答是通过sparkUi中task的输入量和运行时间发现,解决方法是用count估算不同维度下各value的数据条目,然后数量最多的top key进行再赋值后与其他表join 感觉这个地方可以从spark运行
写在前面:jd只写了滴滴国际化部门招实习生,并不知道是数分,所以答得稀烂,很多数理统计知识都忘光了。。。。 一、自我介绍 1、上一段实习中主要使用到的数据分析工具,是否会建模进行数据分析 2、在上一段实习中觉得自己做的最好的一个case 二、概率统计部分: 1、z检验和t检验分别是什么 2、大数定律和中心极限定理的内容和条件 3、假设检验的原理,两类错误分别是什么,之间的关系,怎样使两类错误的概率
sql题没写上来 业务题答的特别简单 感觉面试官根本不想听我讲话
#软件开发2023笔面经# 感觉自己表现还挺好的,问了面试官也说挺好,注意下细节,结果第二天就收到了感谢信,呜呜 一面 3.9 45min 1.自我介绍 2.threadlocal底层实现 3.aop ioc原理应用及相关注解 4.arraylist和linkedkist 5.mysql索引 6.mysql并发相关问题 7.mysql事务 8.mysql刷盘原理 9.redis持久化 10.red
一面 主要是深挖简历 二面 深挖简历 辛普森悖论 场景题:请问乐刻目前发现似乎女生更喜欢团课,男生更喜欢单独练习,你会如何去验证这个发现以及如何去采取相应的措施 三面: 简历 如何看待乐刻的商业模式 讨论一些兴趣爱好啥的。。。你最近看的是什么书介绍一下 三面是两个人,还有一个hr hr会问你的个人信息以及期望薪资,最后问你如何看待加班
1、淘宝服装品类如果构建指标体系评估业绩情况,如何构建? 2、如何搭建天猫的业务监控指标体系? 请问有大佬可以分析一下思路吗
1.自我介绍; 2.有做过落地的实际项目没; 3.介绍一下xgboost与GBDT的关系; 4.介绍一下常用的聚类算法(K-means); 5.了解NLP吗,介绍一下BERT的结构(模型结构、任务); 6.如何缓解数据稀疏、冷启动等问题; 7.反问(主要做什么业务,具体需要使用哪些算法); 8.总结:面试过程简单,没有算法题,一面过了就说线下走流程,已拒绝;
#互联网公司爆料# 这个公司我是参加的校招,当时面试我的估计是一个组长,问了大数据SQL,以及spark,对于SQL我轻松秒杀,spark当时也学习了没啥压力,面了20分钟直接通过后面是一个技术负责人面我,问了一下hive,MapReduce,Java集合,也是直接通过,感觉技术不难,最后HRBP直接来面我,也是直接过,后面就是直接发offer,薪资真的不高,就11k,13薪吧,我感觉不高直接拒绝
投的是数据分析方向 内容是计算机知识,金融知识,计算机知识的考察形式是单选和多选,金融知识的考察形式是单选。 两道编程(一道sql,一道没规定我用的c) 系统是赛码网 系统很糟糕,我写SQL语句还会提示我无法保存,可能是网站怕SQL注入,但是对于要写SQL代码的题目就很难受。而且不支持TAB键,只能打空格。
50亿不重复的数据---2G内存--找中位数 int范围是2^31--2*10^9, 没有符号的貌似也不够 5*10^9, 假设是int,4字节, 2*10^10B~KMG---20G左右!!!注意是2^30 所以只需要分成10个即可,按照最高位0000-1111 这样子写入到16个文件,并且计算每个文件的数量 随后只需要排序,寻找中位数 同理快速判断是否存在,也是Bitmap或者按照位进行文件分
#互联网公司爆料# 这个公司也是搞物流的吧,估计是做国外的,面试我的第一面是大数据组长,应该是数仓的组长,主要是数仓建模,hive基础,以及spark,以及数据服务以及做的项目的细节,整体面试还可以,终面是技术最高负责人,估计是个副总有40多岁,问了我大数据集群怎么搭建的,服务器是怎么设计的,对于大数据的架构的分布等等吧,感觉是以架构师来问的,薪资好像是15乘14,年终估计拿不满吧,终面还挂了,好
1. 自我介绍 2. 问了一下简历上的项目(研一在国电做的) 3. Spark有没有过调优 4. 基于我对Spark调优的一些回答进行追问: ● 我提到了利用RDD缓存进行RDD复用,追问Spark缓存一般可以用什么函数做到(cache,presist) ● 追问并行度的设置方法(配置文件或在代码中) ● 并行度的值一般根据什么设置(CPU核数的2-3倍) 5. Hive执行原理(SQL到MR的过
单选+多选+判断+一道sql+一道编程 数据库 加密算法 tomcat三大组件 中央银行 线性结构 operator new() 七层模型 金融知识(瞎猜)
#互联网公司爆料# 58笔试通过但面试没有过,面试我的人首先问的还是数仓建模,我当时这方面还是刚学,不是很懂,问的建模细节还是不会,直接挂了,但整体还是可以的,薪资估计16起步吧,双非本科估计就是最低的白菜价
银泰百货 数据开发一面(30min) 自我介绍 CV项目简介,项目时间, 针对一个项目进行提问,用到的算法,怎么选择,不同算法的优缺点 另外一个项目的具体工作,不同图表的用处有啥区别,图表的组合有啥作用(比如柱状图和折线图), 两段实习的工作 用python的那些库,用pandas的那些函数? SQL语句怎么优化(谓词下推)?