一家正在迅速发展的电商公司,两年竟然融资两轮(好夸张),Hr主打的就是一手能学到很多东西(因为涉及到供应链、商品、用户多个角度),入职后可能需要去一线学习。 一面:(1月31日,数据组同事) 实习中感觉最有趣的一件事 服务分实验的设计流程,实验结果,有没有使用到ABtest,以及ABtest的结果? 实习中遇到的最难的一件事? sql,连接有几种;聚合的方式有几种? python,缺失值处理的方式
投递+约笔:半个月 时长:2h 形势:HackerRank 外企的coding笔试基本上都是用的HackerRank,但题目基本上刷不到只能自己平时多做做题培养coding思维。 一共考了两道编程题,合计两个小时。 Q1:股票分红,输入 股价 分红 时间 输出 现股价 Q2:动物表演,找某个时间房间内的最大动物 题目本身没有涉及到多难的算法,核心难点在于—— 必须是stdin和stdout输入输出
公司:快手 岗位:数据科学家 形式:视频面试 视频面试平台:轻雀 时长:60分钟 流程: 0、面试官自我介绍及面试流程介绍。 1、自我介绍。 2、对于样本和总体这两个概念,它们之间的关系是什么?它们的差异和相似点分别是什么? 3、了解哪些抽样方法?不同抽样方法分别适用于什么场景? 4、写一下随机
题主背景:对计算机基本上一窍不通的半个数学人。 题主在面试屋外等候时,工作人员问题主昨天是不是来咨询过(昨天校招宣讲),题主点头,工作人员又说,“你的简历我们印象非常深,我们今天主要是偏后台开发的,你先跟后台开发的一起面试,之后有其他部门想要你了我们再推你走哈”,题主此时还没有感受到不妙…… 数据结构:首先提问数据结构,问树的结构掌握哪些,如何用Java实现一个哈希表,链表结构有哪些。 数据库:询
之前投了多模态方向泡池子泡了大半个月,16号转投数据科学当晚安排面试。 面试过程中感觉还不错,问题基本都答上了,但面试官提过几次说我的科研方向有点偏,还推荐我去另一家企业呃呃了属于是。 希望后续还能被捞上来
1、自我介绍 2、数据仓库为什么要分层,目的是什么 3、DWS层和DWT层是怎样划分的 4、PV和UV分别是什么 5、数据仓库建模的两种形式 6、范式建模中的第三范式的原则 7、维度建模中最常见的建模形式是什么区别是什么 8、如何评判数仓的优劣性 9、MR流程是写的MR程序,还是通过hql 10、用户留存率的计算公式 11、HDFS的写流程 12、MR的底层原理 13、MR
#互联网公司爆料# 这个公司我是参加的校招,当时面试我的估计是一个组长,问了大数据SQL,以及spark,对于SQL我轻松秒杀,spark当时也学习了没啥压力,面了20分钟直接通过后面是一个技术负责人面我,问了一下hive,MapReduce,Java集合,也是直接通过,感觉技术不难,最后HRBP直接来面我,也是直接过,后面就是直接发offer,薪资真的不高,就11k,13薪吧,我感觉不高直接拒绝
9.11 一面 1.自我介绍 2.介绍实习内容 3.对数仓分层的了解 4.对ab实验的理解 5.对实时了解吗 6.logistic回归的损失函数 7.口述sql:简单窗口 8.反问 9.19约线下,调整成线上 9.26 二面 两个面试官 面试官1: 1.自我介绍 2.更想做数开的工作还是数科的工作 3.解释spark中的水印 4.对实时数仓的了解 5.spark数据倾斜怎么处理 6.设计一个bi产
#科大讯飞求职进展汇总##春招# 面试官人很好,还挺帅(有点像shy哥? 全程拷打简历,会重点问实习和2个左右项目 本来我在不断引导面试官问我数据库和机器学习方面的内容,但是面试官好像不怎么想问,连数据怎么清洗的这种都没问,就问了聚类了解那些?k-means聚类怎么优化?肘部法则和肘部加速的区别? 由于我项目大都是deep learning方向的,所以都在让我讲dl方向的东西 还有就是项目遇到了哪
自我介绍 数据倾斜问题 spark的shuffle相对于mr的shuffle有什么区别 spark的stage怎么划分的 yarn中都有什么,作用是什么 hdfs读写流程 rpc和http分别是什么,有什么区别 项目中都有什么数据 数仓的分层,每层都做了什么事 反问 金风科技二面总经理面 自我介绍 总经理问题: 1.本科和研究生都是通信,为什么选择大数据 2.怎么在完成学业同时学习大数据的 2.对
2023/10/10 平安科技 大数据开发(37min) (1)自我介绍 (2)对于平安科技的数据开发岗的理解和认为它是做什么的?和自己的契合度是怎么样的? (3)数据库学习到哪些东西,学了多久,什么时候学的,有实践过吗? (4)sql分哪几类,违反主键约束会出现什么问题,索引什么情况下回失效,有自己去安装过吗?(之前没准备数据库的内容,答得很差,后边的面试才好好看了数据库的东西) (5)使用sq
一面群面 一共10个人,自我介绍,然后是一个简单的笔试。 内容就是电子基本知识:三项电火零之间多少度,电阻器,线性负载,UPS是哪里发热。总之就是10道选择题,很简单。还有两道简答题:1.向人推销自己的电子产品;2.对售前的理解。我是看了一本书《商战往事,解决方案与销售配合打单》,然后自己总结的。 最后是无领导小组讨论。这个讨论的重点我认为有两个,第一个时机是先发制人,给大家安排时间,显得自己很厉
连续型变量是如何做数据填补的 上一节中讲的Embarked的填补是一种离散型变量的填补方式,也就是通过统计规律来预测。那么对于连续型变量如果使用这种方法就不合适了,而应该使用某一种插值方式。比如Age这种数据,根据统计规律,假设其他人年龄多数是50岁,其他人都小于50岁,那么就预测是50岁吗?显然不对,而应该是小于50的某个值。那么如何根据统计规律来计算插值呢?我们来介绍一下mice mice就是
补全数据的纯手工方案 我们以泰坦尼克号数据集为例(不了解这个数据集请见《十八-R语言特征工程实战》)。 先重温一下这个数据集里面都有哪些字段: PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked 分别表示: 样本编号、是否得救、乘客级别、姓名、性别、年龄、船上的兄弟姐妹数、船上的父母子女数、
#蔚来提前批笔试# 投的是数据科学家岗位,7.14做的笔试,至今状态没变。基本是算法题,VE人工智能卷。15选择,2道编程(一个股票最大收益,一个二叉树)。😥以为要考模型。 #蔚来提前批笔试#