#### 面经: + 2023.02.24 性格测试:(10-20min) 听说是跟很专业的团队为华为量身定制的,一类题目里面如果选了相同程度的类似答案选项,马上会再就这几个选项问哪一个跟你最像,有坑,如实按照感觉填就好啦~ + 2023.02.25 集体面试:(1h) 10min自我介绍(1min轮流) + 25min小组讨论(5min审题+15min讨论+3min派代表输出讨论结果+2m
6.8号电话通知简历筛选通过,问我什么时候有时间,进行电话面试。 6.9号电话技术面,30分钟,问的内容比较基础,基本上都是围绕着简历内容展开。 自我介绍 简历中项目的详细内容 Flume和Kafka如何搭配使用(项目中涉及) 项目中的数仓是如何构建的?如何分层的?分层的意义在哪里? 项目中用户画像是如何展示的? Spark和MR有什么区别 Spark启动后的程序流程 Spark宽窄依赖 Spar
首先说一下面试感受,一共三个面试官,全程20多分钟,问问题主要从业务的层面上 问题汇总: 1、自我介绍 2、说一下比赛的项目 3、BERT的具体原理? 4、说一下chinese-wwm-bert模型的改进? 5、说一下roberta为什么去除掉NSP任务? 6、比赛赛题的业务场景?一直问为什么这么做,能用来做什么?(我有点杠。。。) 7、现在有文本、图片、数值的数据你来怎么处理? 反问:
一面 面我的是国际化广告产品部:数据科学组的负责人,30来岁,男。人真的超级超级好,超级有耐心,不会嫌弃你一问三不知,而是会努力引导。 主要是4个部分。 一、自我介绍 我自我介绍前,面试官有跟我说希望我在自我介绍的时候能突出“自己与这个岗位的匹配度”! 然后我主要还是按照自己原来准备过的3 part来说: 1)硬核能力(代码+统计知识) 2)业务、商业洞察力(之前实习积累的经验+2次商赛经历) 3
查了下海信网络科技主要是做大数据相关的智慧交通和智慧城市。 35min 一位友善的大哥 自我介绍一下? 说一下你的项目是在哪搭建的?有上线吗?使用CDH吗? 数仓项目说一下你的项目是如何分层的? Spark 项目说一下为什么用 Spark 不用 Flink? 知道数仓中数据血缘关系的概念吗?你在项目中是怎么管理的?知道他的工具吗? 数据治理知道不?面试官说可以看一下 Atlas 你在数仓项
30左右的一位前辈 25min 自我介绍 为什么选择大数据这个方向 从想要计算的效果,各方面使用的组件,还有最后的结果来介绍下项目 为什么用ES 项目难点说一下 说一下你是怎么理解Spark 的 说一下Java 多线程 Java 讲一下锁机制,说一下读写锁的实现原理 JVM 垃圾回收机制讲一下 反问 业务场景? 主要的难点? #海康威视##大数据开发工程师#
背景:本硕中上985,本科数学专业,硕士计算机,投递岗位总行数据开发岗位,有两段算法实习,自己跟着CMU做过一个数据库项目,目前还在做一个TInyKV,代码能力一般。 9.30 笔试 笔试内容包括 - 行测 - 基础知识: 1. 大数据开发相关,spark,hive,hadoop等内容,因为没有做过相关工作,基本靠猜 2. 计算机
lz投递的是数据开发工程师方向 1. 笔试共两个半小时,分为两个部分 2. 第一部分是行测,共60道题目,具体题型分布不太记得了,限时60min 3. 第二部分是专业笔试,限时90min (1)单选 23题 (2)多选5题 (3)判断7题 单选、多选、判断主要考察数据库、Hadoop相关知识 (4)编程填空题18题 都是SQL题,难度适中#上海银行#
关于数分的面经好像很少,发一下积攒一下人品,面完的友友可以互通一下有无呀,许愿能有二面~ 时间点:9.21投递,9.29收到笔试,9.30笔试,晚上收到约10.5面试的邮件(上银前面好像比较快,会在一个星期左右发笔试,要是还没收到估计是凉了) 楼主是搞深度学习的,对数分可能不太熟悉,面前一直准备复习SQL,之前一直找的算法岗,一直没怎么问过数据结构,所以回答的不是很好,害 腾讯会议的形式,一共五个
这是我面过时间最长的面试 1h20min 技术面+hr面 2个数据部门的主管+1个hr 技术面 第一个主管主要疯狂轰炸关于机器学习基础知识, 包括各个基本模型的流程,比如SVM,LR,聚类算法等 以及深度学习的一些模型知识CV这些,还想问我NLP,但我说我们接触过 总之能问的都给你问一遍。 然后深挖简历上关于数据建模的项目,问的很细很细 平常了解数据科学领域的前沿知识用什么公众号之类的 第二个技术
原定14.30进场(14.37才进。。。) 1. 自我介绍2min 2. 上一段实习都做了什么 3 4问的两个实习项目用到的算法 5. hive sql 区别 6. hive底层原理知道吗(不知道) 7. Python数据处理用啥包 8. 实习算法实现是调包还是(当然是调包呀😬) 8. 反问 出面试间的时间倒是贼准😅。。。(14.50) 呜呜呜可能是对我不感兴趣?别人问20min为啥俺就13m
11月18号面的,等了40多分钟吧,然后面试25分钟,是群面的形式,我们小组有6个人。 首先是每个人依次做自我介绍,然后说大家在自我介绍中都谈到了学习和实习,问大家除了这两个方面研究生阶段有什么收获,最后就是根据简历随机找两个同学提问
珠海优特:笔试很简单。 面试什么都没问,面试官边面边看表。全程没有问过任何技术点。我抱着想练练手的心态继续有一搭没一搭的聊,零收获。最后也没过。 宇信:这次准备了一点。介绍完实习的项目之后开始聊天。中间问过一些技术的点: 除了mysql还有没有用过其他? 索引真正失效(并非指最左匹配等情况)了解过没? 和数据库的交互除了sql还有没有其他?例如存储过程,分库分表等? 能感受到面试官应当有相当的经验
一面 1.SQL题1 表a 用户注册表: uid、注册日期、地区 表b 用户活跃表: uid、登陆日期 留存有两种活跃用户留存和新增用户留存 计算注册用户次日留存 日期的加减函数 date_sub(日期,interval 1 day) 2.SQL题2 成交信息表: uid 成交类别 成交日期 所属地区 计算最近三天每个地区top3销量的产品 3.业务题 推测五道口一家奶茶店一个月的销售额 二面 B
一面 1.SQL table_a dt, city_id, device_id, gmv tips:每个device一天可能有多条记录 (1)求每个城市每天gmv最高的5个device_id (2)求连续三天每个城市每天gmv都在前5的device_id 2.统计题 (1)自变量存在多重共线性,如何通过变量筛选来解决? (2)线性回归的五个基本假设 3.机器学习 (1)DBScan 与 Kmean