淑淑淑芬芬芬数分俺不活咧 早上电话通知面试时间,下午就面 自我介绍 实习的是啥公司,主要做了什么 介绍项目内容 指标分析思路 异常指标怎么处理,如何归因 异常指标影响因素怎么计算 遇到什么特殊数据情况、原因是什么、如何解决 618期间做了什么数据运营工作、紧急情况下做了什么 是否用SQL、一般用sql做什么 云计算项目内容(项目只是用了隐私保护相关的云计算的场景,没有实现,感觉没啥用,食之无味弃之
#我的实习求职记录# #面试# 5-24上午 博西家电数据分析岗(应该是挂了,唉!) 实习经历介绍深挖 SQL drop和delete区别 (我答的一个删除列一个删除行,但面试官说是一个新建表一个没新建) 辛普森悖论(没答上来,提示了之后总结了一下) 还有几个不记得了 最后是思维题:黑盒拿球问题,烧绳子问题(一根30秒,怎么计算15秒) 反问:工作内容,后续面试流程 面试官问我为什么问第二个问题,
三月底一面,一面完一周二面 一面(HR面): 自我介绍 就业规划 有无读博计划 最成功的经历等 聊了十多分钟就结束了 二面(业务面): 自我介绍 pre一个自己做过的数分案例 介绍了一下部门情况,问我最感兴趣的业务方向 为什么想做数分 大概30分钟 二面完两天给了offer,HR直接说是SP offer 还是拒绝了(还是不够多以及base地) 面试体感很好,福利待遇也还可以
单选考点主要是概率统计,涉及到离散分布,连续分布,贝叶斯公式,全概率公式等,sql题目总体不难。第一道分组求和,第二道比较两个月的涨幅,第三道主要需要用到窗口函数。#拼多多##数据分析##笔试#
字节大数据开发工程师- 人力科技面经 一面 网络模型,每一层的功能 访问一个网页的流程 tcp是如何保证可靠 线程和进程的区别 JVM的内存区域 垃圾回收算法 类加载的过程 Spark和MR的区别 Spark任务调度过程 spark中stag,job,task是如何划分的 spark宽窄依赖 为什么spark比MR快 Hadoop的框架 Hadoop提交作业的流程 Hadoop中是如何找到文件对应
😅😅三面已经挂掉了,有兄弟找我要一二面面经。 HR说data 大数据开发工程师 会捞一下我。因此,来回忆一下前两面的内容,后续如果能被捞继续复习。 一面:一小时 spark 实时处理项目挖掘。 讲一下双流join?双流join 是事实表和维度表还是事实表和事实表join? Redis 主要是用来干什么的? 实验室项目挖掘。 介绍下无人车项目 介绍下Apollo OpenDRIVE 格式这里是用
5/5一面 5/14 二面 5/18 hr面 5/19 OC 一面(1h10min) 1.自我介绍一下 2.介绍一下你的项目 2.1 Mysql全量数据规模 2.2 既然Mysql能存储,为什么要导入到hive中 3.说一下MySQL的ACID特性 4.脏读和幻读分别是什么含义 5.spark持久化的级别和作用 6.spark任务出现数据倾斜有哪些方法解决 7.hive没办法创建分区怎么理
1.js事件循环(八股吟唱) 2.dom渲染在事件循环的哪个阶段(深入一点我直接g)❌ 3.虚拟dom(八股吟唱) 4.为什么js操作虚拟dom要比浏览器操作真实dom要快?(ok深入一点我又g)❌ 5.ReactDOM渲染器是如何工作的。(说出来一点点) 6.React 的异步渲染和并发模式(就说了state批处理。。)❌ 7.(实习经历一顿拷打。。。。)❌ 8.闲聊(顺带拷打。。说到喜欢看gi
介绍项目 说一下遇到的难点 项目的核心指标就是**的占有率吗? 怎么验证数据的准确性? 有遇到过数据对不齐的时候吗,怎么发现的。 讲一下数仓分层的好处 如果需求方想临时插一条数据进数仓,怎么解决。答找后端更新数据,我再重刷。 除了这个办法呢?能不能在数仓中直接insert一条数据。 为什么不建议直接往同一个分区追加新的数据? 为什么要选择数据开发?别人都说数据开发是sql boy,你怎么看这句话。
本人社招,面试大数据研发工程师岗位,一共三轮面试。 1、一面(技术面),约40分钟,面试题如下: (0)自我介绍,别照着简历说,补充说些简历上没有的,比如哪里人、兴趣爱好、优势有哪些等。 (1)笔试,编程题,语言自选,题目:输入一个字符串,找出其中的整数,按升序排序后输出,多个相连的数字为一个整数,排序可用类库自带方法。 实现很简单,这里就不提供答案了。 (2)笔试,SQL编程,
问题内容: 我正在使用Elasticsearch内置的简单分析器https://www.elastic.co/guide/en/elasticsearch/reference/1.7/analysis- simple- analyzer.html ,其中使用了小写标记器。和文本 Apple 8 IS Awesome 以以下格式标记。 您可以清楚地看到,它缺少对数字进行标记的功能,因此,如果现在仅使
问题内容: 我正在尝试传递给jasper报告字符串位置的模板。因此,我在模板和值中传递了参数的键。当我在项目中有图像时,一切都在工作,但我想在另一个地方使用它。有什么方法可以从例如属性文件中读取参数?我不知道为什么这种解决方案不起作用: 我的形象: … 错误: 问题答案: 好的,我找到了…应该是:
因为所有的网络通信最终都是基于底层的字节流传输,因此一个高效、方便、易用的数据接口是必要的,而 Netty 的 ByteBuf 满足这些需求。 ByteBuf 是一个很好的经过优化的数据容器,我们可以将字节数据有效的添加到 ByteBuf 中或从 ByteBuf 中获取数据。为了便于操作,ByteBuf 提供了两个索引:一个用于读,一个用于写。我们可以按顺序的读取数据,也可以通过调整读取数据的索引
1.数据分层概念 2.Hadoop 和spark 优缺点 3.数据倾斜 场景题 大表和小表join 4.宽窄依赖 5.sql题 6.走楼梯算法 7.hive的用户自定义方法区别
本文向大家介绍深入分析python数据挖掘 Json结构分析,包括了深入分析python数据挖掘 Json结构分析的使用技巧和注意事项,需要的朋友参考一下 json是一种轻量级的数据交换格式,也可以说是一种配置文件的格式 这种格式的文件是我们在数据处理经常会遇到的 python提供内置的模块json,只需要在使用前导入即可 你可以通过帮助函数查看json的帮助文档 json常用的方法有load