没有发笔试,直接约面试了(4.20日),面了50分钟,面试官表示所在的组是中台的数分。 1、自我介绍(1分钟) 2、基础知识提问(5分钟): 假设检验详细介绍,原理,引申到各种检验的区别 辛普森悖论 4、介绍之前的实习项目(深挖20分钟) 挖的很深,有很多引申的提问 因为有实习涉及到AB实验,于是引申AB实验的知识(包括样本量如何选取等等) 涉及对实习公司所在赛道商业模式的介绍 对选取指标方法的拓
1、自我介绍;2、校内情况;3、项目经历;4、为什么选择数据分析岗。整体感觉像是在唠嗑,问的都很宽。
******************* 春招保驾护航! 参考回答: - 第一步:定义指标。几乎所有的产品案例研究都从一个模糊的目标开始,第一步是将此目标转化为可以优化的指标。 比如。 "我将小红书上用户的参与度定义为每天至少采取一项行动的用户比例,其中行动意味着与网站互动,即发布、喜欢、上传图片等" 。 - 在指标确定之后,选择我们认为对该指标起到影响的变量特征。比如用户特
2020二本软件工程 4.24 接到招聘的信息,通过简历,收到机试链接,一周内考试。 4.30 在五一劳动节第一天早上机考,手机登录小程序,录屏+摄像头;三道题分别为100分、100分、200分;考试时间150分钟。 三道题分别为牛客两道中等+一道较难 1、NC199 字符串解码(通过率100%) 2、NC20 数字字符串转化成IP地址(通过率80%) 3、solo和koko是两兄弟,分一堆积木,
在BOSS直聘上投的简历,之后邮件收到邀请面试信息 朗国HR说投简历的时候需要附上作品集,需要在邮件里面更新一下。 当晚修改好作品集之后,更新了过去。后面大概两天后收到电话,问方不方便进行电话面试,算是人事初面。 1.在过去三年的UI设计工作经验中收获了什么,有什么难忘的事情? 2.对于UI设计岗位个人是什么想法,会不会觉得UI设计是吃“青春饭”职业? 3.对自己的职业规划是怎么样的? 专业面问题
面了三家互联网,b站携程小红书,拿了一家实习offer,问的比较多的题记录分享一下。 一开始都是先自我介绍,然后就是做题。。 首先是SQL题。 1.左连接和右连接的区别 2.union 和 union all的区别 3.熟悉开窗函数吗?讲一下row_number和dense_rank的区别。 4.hive行转列怎么操作的 5.要求手写的题主要考了聚合函数和开窗,row_number(),sum()
1.自我介绍 2.数据采集相关,怎么把kafka中的数据采集到mysql中? 忘了 3.hive,两张表的重复数据,怎么去重? 回答distinct,group by ,开窗取第一条, 开窗函数是哪个? 没回答上来 4.udf函数写过吗,flink消费kafka中的数据写过代码吗,需要看代码? 5.使用java干过那些代码? 面试时长:10分钟,面试效果,差 不足:对于简历上的内容,回答支支吾吾,
1、计算机网络: (1) TCP的三次握手和挥手 (2)OSI7层模型,每层分别有什么作用 (3)对哪个层的了解比较多一些,平时用得最多是哪一层 (4)传输层的协议有哪些 (5)是否对ip协议有了解,ip协议的分类等 2、数据结构 (1)数据结构的分类 (2)红黑树、平衡二叉树查找的过程、原理 (3)hash,hash冲突,解决hash冲突时单链表长度过长的问题 (4)大小堆 3、算法 (1)堆排
上来先自我介绍然后让自己挑一个项目介绍。后续面试官问了很多问题 1 特征工程如何做 2 特征筛选都有哪些介绍一下 3 随机森林原理 4 支持向量机介绍一下 5 深度学习框架会哪些介绍一下 6 transformer介绍 7 attention机制都有哪些介绍一下 8 lstm原理以及相比于rnn的优势 9 时间序列预测都有哪些方法 10 介绍一下arima算法 11 数据库都会哪些 12 深度学习
1. 你觉得数据分析师应该具有哪些能力? * 首先是硬实力,SQL、Excel、PPT等分析数据和展示数据的工具需要会 * 其次是软实力,当我们通过数据分析获得到洞见后,需要向别人展示,说服别人接受我们的建议 2. 你过去使用过哪些图表来直观的表达你的观点?聊聊你在案例大赛的经历就可以。 * 使用频次最高的是柱状图和折线图,可以表现事物随时间的波动趋势 * 其次是散点图,可以用两个维度给事物排名
自我介绍环节 一般在2-3分钟左右,建议一定要提前写好,并且熟读,面试时才能说得流畅,有逻辑。 HR面环节 1.为什么选择我们公司? 2.你觉得你沟通能力怎么样,举个例子呢? 3.学习成绩,这个是一定会问到的。 4.职业发展规划 5.问你如何克服困难,你印象最深的一件事是什么?等等 专业面环节 专业问题针对性就比较强,比如合成和分析岗位,会对实验操作技能有一定的要求。但如果你所做课题面试岗
面试高频题1: 题目:介绍一下k-means,你的数据如何处理,模型的输出是什么? 答案解析: 介绍kmeans: 第一步:数据归一化、离群点处理后,随机选择k个聚类质心 第二步:所有数据点关联划分到离自己最近的质心,形成k个簇; 第三步:重新计算每个簇的质心; 重复第二步、第三步,直到簇不发生变化或达到最大迭代次数; 数据如何处理: 为了防止均值和方差大的维度将对数据的聚类产生决定性影响,所以在
面试高频题1: 题目:处理噪声数据方法 答案解析: 1、分箱 分箱方法是一种简单常用的预处理方法,通过考察相邻数据来确定最终值。所谓“分箱”,实际上就是按照属性值划分的子区间,如果一个属性值处于某个子区间范围内,就称把该属性值放进这个子区间所代表的“箱子”内。把待处理的数据(某列属性值)按照一定的规则放进一些箱子中,考察每一个箱子中的数据,采用某种方法分别对各个箱子中的数据进行处理。在采用分箱技术
我是大数据欧老师,曾在互联网某大厂任大数据负责人,从业大数据领域近 10 年,全网粉丝 5000+,从很多候选人的面试和咨询中复盘了大数据工程师的面试全流程,如果你有求职大数据工程师的计划,欢迎找我聊一聊! 直接拿走去复习!!! Hive 知识点(上)- HSQL 语法 什么是窗口函数? ROW_NUMBER() / RANK() / LAG() / LEAD() 的含义? RANK() 和 DE
我是大数据欧老师,曾在互联网某大厂任大数据负责人,从业大数据领域近 10 年,全网粉丝 5000+,从很多候选人的面试和咨询中复盘了大数据工程师的面试全流程,如果你有求职大数据工程师的计划,欢迎找我聊一聊! 直接拿走去复习!!! Spark 知识点(上)- 原理题 RDD 的概念?RDD 的常见算子? Spark 和其他框架的比较?和 Hadoop 的比较?Spark Streaming 和 Fl