先是让我做自我介绍 1.hadoop是什么,hadoop的组成,以及每个组件的作用 2.hive跟hadoop是什么关系 3.hive内部表和外部表的区别 4.hive分区和分桶 5.hive中order by,clustered by以及sort by区别 6.hive中三个开窗排序函数的区别 7.hive开窗函数 8.hive的基础架构 9.hive优化 10.数仓分层以及分层的好处 11.h
美团平台-美团平台技术部 1h 3.29 1. 自我介绍 2. 项目难点 3. Netty有哪些应用场景,可以做哪些事情? 4. 选择Netty的原因(Netty的优点) 5. Netty中的EventLoop了解吗 6. 数据库表结构设计:美团打车场景,乘客打车,发出自己的订单,司机接单,司机有一些车辆(说的范式建模) 7. 维度建模了解吗?如何设计 8. 打车场景,乘客发布订单,对应司机接单,
4.2 40min 无手撕 1.自我介绍 2.对大数据,分布式技术的了解 3.介绍一下Spark 4.介绍一下Hive 5.问实习项目 6.场景题,数据分析/数据科学相关的吧,鼠鼠答不上来一点,这部分感觉巨尴尬,由于缺乏数据分析经验,只能凭借自己的游戏经验和一些数据分析原理(如AB Test)来乱答,一度沉默十几秒,尬死了 7.后面就是闲聊了,问了一些个人基本情况 我的评价是寄,面完试打开手机,同
#科大讯飞求职进展汇总##春招# 面试官人很好,还挺帅(有点像shy哥? 全程拷打简历,会重点问实习和2个左右项目 本来我在不断引导面试官问我数据库和机器学习方面的内容,但是面试官好像不怎么想问,连数据怎么清洗的这种都没问,就问了聚类了解那些?k-means聚类怎么优化?肘部法则和肘部加速的区别? 由于我项目大都是deep learning方向的,所以都在让我讲dl方向的东西 还有就是项目遇到了哪
3.28 广州电信研究院 人工智能分析师1. 不长于5min的自我介绍 2.根据自我介绍提问开放性问题 3.国内AI领域的发展方向 4.给一个具体场景分析用哪些模型 输入输出是什么 5.忘了 印象:总体比较融洽 没有技术性问题 感觉这个岗位可能不用怎么写代码 看了同一批面试的同学 感觉bg都很不错 目前没收到二面 估计凉了 可能方向不太匹配 #电信研究院##电信研究院广州##人工智能#
#面经# #虎彩集团# 2024.4.2 bg双非二本,非科班,第一次面试,表现不错 40min业务面,电话面之后的线上约面,不知道算是几面 1.自我介绍 2.介绍一个觉得比较有价值的经历(表达清晰,答得挺好,不过可以更简洁,直接说要点) 3.针对经历深挖 4.表达对于数据分析的理解 5.数据分析所需的技能 6.excel常用函数,sumif和sumifs区别,countif和countifs区别
50min 给我一点小小的pdd 震撼 1. 自我介绍,巴拉巴拉说了一堆 2. 平时使用什么样的编程语言,答 cpp 3. 用 cpp 实现一个哈希表,功能尽可能丰富(满脸问号,差点没绷住 然后就开始了漫长的敲代码环节,一开始尬在那了,反应了好半天才开始写。 写完后问怎么解决哈希冲突 4. 做项目过程中如何保持代码质量 5. 看过哪些开源项目 6. STL 库文件为什么都是.h不用.cpp 7.
个人bg:211本硕 岗位:数据开发 投递日期:3.23 当前状态:4.2 一面 简短自我介绍,然后开始拷打, 1、对数仓的理解,数仓是个什么东西,用来干嘛? 2、spark与mr区别 3、spark的shuffle可以不排序吗?为什么 4、采用byPass shuffle的依据是什么 5、shuffle的本质是什么? 6、开发过程中有没有遇到过难题?如何解决的? 7、项目在哪做的,环境怎么搭的
全程无八股 项目: 1、介绍你的工作内容 2、数据库构建过程 3、服务架构 4、如果一个业务很慢怎么办 5、微服务架构的选型 6、大数据处理的技术(不太会。。。。) 算法: 手撕 四则运算,一个string数组,{“1”,“+”,”4“,”/“,”6“,”*“,”2“}算结果(两个辅助栈) 反问: 还有几轮(最多一轮技术面+hr) 整体情况还可以 PS:流程现在显示复试,没有之前会议连接,是不是秒
春招流程:网申---->测评--->初面---->复面----->发offer 网申:除了正常的个人信息外还需要写点小作文夸夸泸州老窖,然后写为什么要选择泸州老窖什么的,总体来说网申淘汰率不高 测评:前一天刚网申,第二天就发了测评链接,题目主要是一些申论形策+智力题+性格测试题,难度不高,好好写问题应该也不大 初面:测评完当天晚上就给我发了初面短信,先测试设备,然后发正式初面的腾讯会议的链接和会议
我面试了零售部数据分析岗,下面将问题整理一下: 一面 1.自我介绍 2.介绍一个实习中最深刻的项目1.这个项目的分析思路是什么样,有没有出现和预期不同的情况 2.如果应对这种预期与实际不符的情况 3.用户通过活动转化的行为路径会是怎样,怎么判断是哪个环节出现的问题 4.SQL:次日,三日,七日留存 5.SQL::找各品类下gmv最高的商品 6.SQL的优化方法 7.几个join的区别 8.最后考核
1、自我介绍 2、数仓怎么自学的 3、整个项目架构说一下 4、数据域是什么概念(提到了数据类型),那如何界定数据类型呢 5、总线矩阵构建过程 6、dwd层怎么设计的 7、了解业务过程这个概念吗 8、分域的话,在dws表中有没有可能会跨域(举了个互动域和活动域的例子),结果告诉我这样的话你的互动域设计的其实是有问题的(挖坑给我跳,悲) 9、星形模型和雪花模型 10、缓慢变化纬为什么用拉链表,他说他第
暑期实习和秋招面过的数据分析也有几十场了,给大家汇总一下亲历的高频考点,面试前一定要反复练习哦 一、口述回答问题: 1.SQL查询过慢,如何解决? 2.union v.s. Union all 3.SQL执行顺序 4.视图 v.s. 表 5.第一范数,第二范式,第三范式 二、现场写代码: 1.使用窗口函数求某日每个省GMV前3的商品,给定字段province,sku,gmv,dt 2.求每日新增用
一面 1.简历实习相关 2.gmv 下降如何分析 3.sql留存率计算 连续登录用户 二面 1.简历相关 2.如果在app 内短视频/直播页面增加搜索入口跳转搜索落地页,如何衡量它的效益(这个AB 测试当时答得不是很好,现在的想法是做 AB 测试后,用 PSM 匹配去衡量实验对照组用户区分搜索入口来源的各个指标 ) 3.如果一个搜索词搜索量突然下降,怎么分析,可能的原因 4.sql汇总当月至今的每
1. 自我介绍 2. 要不要读博 3. 上一段实习经历中最困难的是啥/最不舒服的是啥/怎么解决得困难 4. 有女朋友吗?在哪里 5. 家在哪里?未来想在哪里工作?父母什么看法。 6. 投阿里没有,为什么不去阿里(感觉答得稀烂|我说投了被拒了) 7. 目前在进行中的应聘有哪几家,会选择去哪家 8. 啥时候能来实习?实习到啥时候 反问: 包住宿吗? 多久出结果?我有啥可以提高的