面试官很好,这是我秋招面的时间最长的一个面试,整整1个小时。 1.自我介绍 2.挖项目 3.五个sql手撕,不让切屏 4.python口述手撕 5.奥数题(如何估计一个房间有多少老鼠) 6.详细问经历,每个经历都问
一面30分钟,总体感觉面试官温和还挺好的 1.自我介绍 2.根据简历提问了一点问题 3.要是给你一个场景打标的任务,你会在路口场景怎么打标(回答红绿灯车道线什么的) 4.要是没有红绿灯车道线,也没有标志物,是无保护路口,怎么做 5.怎么捕捉cut in场景,你会用什么判断 6.混淆矩阵 7.sql熟练程度,口头说了一下 8.python写快排 9.linux知道多少,了解ros系统吗 10.反问
一面: 1.涉及过数据挖掘的项目讲一讲,这里分错的样本有没有研究一下为什么会分错。 2.讲一讲SVM、XGBOOST原理。 3.知不知道决策树剪枝,具体怎么做的,在哪一步做 4.知不知道LightGBM 5.深度学习有没有了解? 6.过拟合的L1范数和L2范数有什么区别? 7.mapreduce原理和过程 8.给key,value两列,找出每个key里第二大的值并输出。用python自己定义一个数
问题: 自我介绍 优缺点 别人怎么评价你 转向数据分析的契机 实习和竞赛哪个更印象深刻 实习中遇到的困难和解决的方法 对岗位的期待 反问 会不会影响学业 到岗时间 非常快,加起来20分钟
1.自我介绍 2.收入分析项目中的指标体系搭建思路 管理视角+分析视角指标拆解,维度细分 3.专员的主要工作内容是什么 外部能看到+内部业务场景细分 4.对于专员工作质量的评估 主观+客观(数量+质量) 5.对于专员的考核指标是什么呢 回答:从单价中拆出一定的比例进行激励+审核扣钱 改善:出勤、工作质量激励、绩效(以城市整体为参考线)、主观评价 6.专员的收入构成 回答:按工作量,干多少活算多少钱
#数据分析# 下午刚面完字节的产品,晚上哈啰突然通知电话面,数据分析的日常岗(感觉暑期已经招完啦) 本来通知6点面,结果面试官到7.30才打的电话,真的干等了一个半小时 先是深挖了下实习经历和项目经历,没这么给压力也没怎么提问,就是让我介绍一下,然后就是给了几个问题 1.如何估算一个城市的哈啰单车订单数量,考虑哪些指标,用什么模型 2.如何验证你的预测是否准确 3.现在有用户的全部数据,需要判断这
我对Elasticsearch非常陌生,目前我正试图让我的头脑围绕着关于的分析器 我有一个类似的地方列表: null 我在今天的大部分时间里一直在玩不同的分析器和设置,但没有成功。 我需要使用什么样的分析器来实现上述?
本文向大家介绍Hibernate框架数据分页技术实例分析,包括了Hibernate框架数据分页技术实例分析的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Hibernate框架数据分页技术。分享给大家供大家参考,具体如下: 1.数据分页机制基本思想: (1)确定记录跨度,即确定每页显示的记录条数,可根据实际情况而定。 (2)获取记录总数,即获取要显示在页面中的总记录数,其目的是根据该数来确
我有1000个文本文件。每个都有日期(我做了索引)和股票价格(列0)。我已经创建了代码来查找单个文件的价格的移动平均线,以及价格和移动平均线之间的滚动差异。我想为每个文件创建这样的代码。我必须在组中上传它们,因为它需要太多的内存来一次性上传它们。 我想我必须使用for循环来遍历文件并找到每个文件的度量。但我该怎么做呢?我如何将所有文件上传到一个组中,然后将它们分组到一个变量中,然后创建一个循环来查
1.自我介绍; 2.有做过落地的实际项目没; 3.介绍一下xgboost与GBDT的关系; 4.介绍一下常用的聚类算法(K-means); 5.了解NLP吗,介绍一下BERT的结构(模型结构、任务); 6.如何缓解数据稀疏、冷启动等问题; 7.反问(主要做什么业务,具体需要使用哪些算法); 8.总结:面试过程简单,没有算法题,一面过了就说线下走流程,已拒绝;
我正试图将一个文件发送到box(云存储)。应该很容易,但事实并非如此。 我使用RequestBin进行调试。 在命令行上使用curl时,它工作得很好(文件被张贴到框中): 卷曲cli(正确): 生坯 -------------------------------------------------------------------------------------------------nam
本文向大家介绍Python实现的北京积分落户数据分析示例,包括了Python实现的北京积分落户数据分析示例的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Python实现的北京积分落户数据分析。分享给大家供大家参考,具体如下: 北京积分落户状况 获取数据(爬虫/文件下载)—> 分析 (维度—指标) 从公司维度分析不同公司对落户人数指标的影响 , 即什么公司落户人数最多也更容易落户 从年龄维
本文向大家介绍PHP的serialize序列化数据以及JSON格式化数据分析,包括了PHP的serialize序列化数据以及JSON格式化数据分析的使用技巧和注意事项,需要的朋友参考一下 PHP的serialize是将变量序列化,返回一个具有变量类型和结构的字符串表达式,而JSON则是一种更轻、更友好的用于接口(AJAX、REST等)数据交换的格式。 其实两者都是以一种字符串的方式来体现一种数据结
👥面试题目 如何来筛选活跃度前十的用户 思路解析 考察的知识点: - 活跃用户定义:理解活跃用户的定义及其在数据分析中的重要性。 - 指标选取:掌握选择合适的指标来衡量用户活跃度。 - 数据处理:了解如何处理数据以提取有用信息。 - 排名算法:掌握实现用户活跃度排名的算法。 性别留存率分析的具体应用场景 思路解析 考察的知识点: - 用户行为分析:理解性别留存率分析在用户行为分析中的应用。 -
👥面试题目 一副扑克牌 54 张分成等额 6 份大小王在同一份牌里的概率? 本问题主要考察的是组合数学和概率理论的知识点,具体涉及: 组合数学:用于计算所有可能的分牌方式以及目标事件(大小王在同一份牌中)的出现次数。 概率理论:用来计算特定事件(大小王在同一份牌中)发生的可能性。 逻辑回归的原理,应用场景以及优缺点? 当我们探讨逻辑回归的原理、应用场景及优缺点时,我们实际上是在考察以下几个核心知