#数据人的面试交流地# 赫基集团 大数据开发实习生 一面:电话面 2022/06/21 1.sql判断是否有重复数据 2.数据库引擎的区别 3.说一下项目 4.项目中转化率数据异常怎么进行清除 二面:主管加hr面 2022/06/31 项目和经历 建模(雪花模型和星型模型) 渐变字段 笛卡尔积用在什么场景?没想出来,最后面试官说这是个坑,说没人愿意遇见笛卡尔积 还有普遍hr问题 反问 科大讯飞 A
#软件开发2023笔面经# 感觉自己表现还挺好的,问了面试官也说挺好,注意下细节,结果第二天就收到了感谢信,呜呜 一面 3.9 45min 1.自我介绍 2.threadlocal底层实现 3.aop ioc原理应用及相关注解 4.arraylist和linkedkist 5.mysql索引 6.mysql并发相关问题 7.mysql事务 8.mysql刷盘原理 9.redis持久化 10.red
10.16投递 10.17一面(50minute) 自我介绍 项目细节 mysql(这里问了很多) 大数据的基本八股 计算机网络tcp 一道sql题,一道算法题 (吐槽一下百度的如流,用网页端看不到聊天框,最后还是下载了客户端才看到,面百度的小伙伴记住面试了要下载如流) 反问:问了一下业务 10.19二面(30minute) 自我介绍 项目细节流程 两个项目的关系 为什么不继续做大模型 实习多久
一面 实习深挖 对于高耗时任务的代码优化思路 如何发现不必要的扫表 sparksql和hivesql有什么区别 sparksql和hive on spark性能有差异吗,差异在哪 hdfs架构 datanode心跳机制 datanode挂了之后会怎么样,容错机制是怎么样 机架感知 有限内存下的一亿数据怎么排序 了解哪些shell命令 有a,b两个文件,存的都是id,写shell找出a中有但b中没有
官网投递完成测评后一周收到了一面通知,没有笔试,准备了半天的八股最后完全没有用到,有两个面试官,一个面试官介绍了一下自己的部门,问了一些技术不相关的问题,一个面试官问了一下项目,也没有多问,整体下来不到三十分钟。当天收到了 hr 面试邮件,感觉好像 kpi 啊啊啊啊啊😰😰😰 补一个后续7.9 周日正在床上摸鱼,收到了录用函,本菜鸟也终于有offer啦! 感谢东子,我爱东子!!!
一面:(1h) 1.自我介绍 2.选一个熟悉的项目介绍一下吧 3.看你简历上写了进行过数仓的搭建,那你说一下数仓分几层合适? 4.每一层干了那些事儿? 5.你说一下数仓为何要进行分层? 6.数仓的建模方法知道吗? 7.指标分类有哪些?(回答的是原子指标,派生指标,衍生指标) 8.你的ods层为何选择gzip压缩呢? 9.除了gzip压缩还有哪些压缩方法?介绍他们的区别?10.项目中你的hive表使
1.平常是用python还是java?python和java掌握程度? 2.hadoop的组成,每部分有什么用。 3.spark掌握的怎么样,SQL练过哪些题。 4.mapreduce源码看过吗? 5.wordcount的流程。 6.Scala有没有学过? 然后开始挖简历,还问了我一些业务的问题。 说后面会通知二面,也不知道有没有...
最近几个月,谷歌发布了一个新的分析替代方案,称为“Firebase Analytics”。 由于该应用程序已经有谷歌分析,我发现一些障碍,我不知道如何最好地处理。 > 以前,“newTracker”函数需要一个属性ID。现在我没有看到它。这是否意味着它不需要一个? 以前,“enableAdvertisingIdCollection”也可以用来收集广告信息。在新的API里找不到。是自动收藏的吗? “
在Google Analytics(分析)跟踪Ver1中,它具有类。 但当我使用Google Analytics Tracking Ver2时,它没有类。我不知道我应该用哪门课来代替。 在使用Google Analytics跟踪时声明的清单中: 你能帮帮我吗。
有朋友提问 狼叔,关注你和cnode很久了,最近有点迷茫,想请你指点下。 我的情况是这样的,非科班出身,从事前端工作4年,公司使用的技术栈是vue2、vue-router、vuex、webpack,目前的能力处理工作还是比较轻松,但是也很明确自己有很多不足,只是对于如何提升比较迷茫。 不足: 1、非科班出身,计算机基础薄弱 2、对当前使用的技术了解不够深入,很多东西只停留在会用的层面 3、对服务端
9.6一面 (30min) 面试官先说流程,一共考察两部分:一,简历上的项目提问+基础知识;二,个人综合素质与沟通交流能力。感觉更注重模型和特征的解释方面,说是因为要经常跟学统计的人打交道和合作。 自我介绍 项目提问,并穿插着问基础,比如讲一下特征选择的方法,特征重要性等等 问懂数理统计吗?讲一下假设检验的流程。特征选择的卡方检验。 碰到给客户解释不清的东西,或者他听不懂,怎么解决? IT领域裁员
一面: 自我介绍 说一下卡方检验 树的剪枝 GBDT 随机过程 ADASYN(我简历里面写了这个所以才问的) SVM常用核函数 问项目 反问 二面: 自我介绍 GBDT(问的巨细,包括为什么可以用负梯度拟合残差、如果换个loss function还可以用负梯度拟合吗) 拉格朗日插值法具体怎么算的(我简历里面写了这个所以才问的) 回归树用什么损失函数(我回答了一堆分类树的,傻杯了哈哈哈哈) 用三个词
我试图用DAS运行示例https://github.com/wso2/msf4j/tree/master/samples/metrics-httpmon/metrics-httpmon-fatjar。 我的环境是Windows,所以我只是将carbon应用程序和模块zip复制到适当的目录中,如https://github.com/wso2/msf4j/blob/master/analytics/d
本文向大家介绍用Java连接sqlserver数据库时候几个jar包的区别分析,包括了用Java连接sqlserver数据库时候几个jar包的区别分析的使用技巧和注意事项,需要的朋友参考一下 今天在群里看见有人问了这个问题,那就把我自己总结的知识拿出来与大家分享一下吧..当然可能还有什么不对的地方,希望指出: ***msbase.jar、mssqlserver.jar、msutil.jar(支持s
我们将H2用于一个长期运行的流程,该流程将许多短期“事件”存储到一个嵌入式H2数据库中。插入和删除行的吞吐量很高,但事件的频率各不相同。 在半生产系统上,数据库文件已增长到27 GiB。彻底压缩后,该文件只有1.25 MiB。这是一个因素 我知道H2在运行时不会压缩,但会标记并重用可用空间,我认为这应该没问题。在某种程度上,应该在已用空间和可用空间之间保持平衡,并且数据库文件不需要进一步增长。 通