首先做了三道SQL题,主要涉及分组聚合、窗口函数。 3.3 一面 28min: 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min: 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran
时长:1h 由于问题太多,分四类进行整理 0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式 1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);
总共33min,凉透了,可能因为我是第一次面试,没经验,被面试官牵着鼻子走 1、数据仓库和数据库的区别 2、数仓的分层 3、维度建模的基本构成 4、了解缓慢变化维吗 5、说一下拉链表 6、用到了哪些用户指标作为算法的输入呢? 7、协同过滤的常用算法有了解吗? 8、Presto和Hive区别 9、Hivesql和sparksql区别 10、Sql:统计最近下单的用户是在去年12月份的用户数量 11、
- 3/9笔试 - 选择题大概三四十个 - 问答题10个,涉及python,HSFS八股,Java八股 - 3/14一面,全是快问快答25min - 问简历,项目介绍,项目中提到的模型被揪出来问了细节 - 常见的机器学习算法讲讲,深度学习会多少呢? - 编程语言?希望会Java - 各种排序算法,时间复杂度,随便介绍几个呗 - Python的装饰器 - 指针和引用的区别(这是C++,但是当时并不知
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验,求个好运 时长一个小时二十分钟 自我介绍 因为学统计的,问了中心极限定理和大数据定律 机器学习-XGBoost算法简介 两道智力题:逻辑判断谁说谎了和分金条 问了为什么研究生跨专业保研了? Hive和MySQL区别 数据库的索引有什么用 说一下索引的类型,还有B+树索引 数据仓库和关系型数据库区别 Hadoop生态圈简介 问我SQL写的
CIO决策世界以全球化、互联网化的思维整合行业热点话题,为企业IT管理者提供最有价值的趋势分析和技术盘点。在这里,你会看到全球各地资深IT观察者的独家观点,你也会得到各行各业IT实践者的独家秘笈。立足中国,放眼全球,让行业趋势分析带动深度思考,让技术盘点推动IT转型。
三个人面的,我最后反问说认为有什么可以改进的,面试官反问我说之前的面试给你什么建议呢我就说了点,她说我们也是这么感觉得😅
面试10分钟不到,等了快半小时 1 自我介绍 2 项目介绍 3 hdfs读数据流程 4 linux vim命令 5 热门商品topN指标编写 6 为什么选择西安 7 期望薪资
#国企#一面 约37min 1. 介绍一下项目 2. MongoDB分布式存储是怎么做的? - 数据分片是怎么做的? - 如何保证节点间数据的一致性? - 如果有节点挂掉会怎么办? 1. 地理数据如何索引? 2. 喜欢用什么开发语言? 二面 约40-50min - 自我介绍 - 问了一些奖学金的情况 - 介绍项目经历 - 对分布式事务了解吗?解释一下分布式事务是做什么的 - 如何保证分布式事务的原
面试时间;10.27 1.自我介绍 2.实习中项目遇到的困难,如何解决? 这里我以为问我的是一个我之前参与非大数据的项目(脑抽了),😭。然后说了这个项目的东西了。被暗讽了一波,你咋不投其他岗位要来投我们岗位? 3.问了大数据的八股,多种文件存储格式以及它们的作用,spark调优,乐观锁 4.B树和B+树的区别 PS:(经过第二个问题的时候,心咯噔了一下,后面有些会的东西也回答不好了)😱
自我介绍后根据我的项目问我了一些问题,虚拟列表,懒加载,canvas怎么压缩的(这个没答对) 项目怎么实现鉴权的,我说的jwt,巴拉巴拉 然后又问了cookie, 问了防抖节流 项目跨域是怎么解决的(项目上线后用反向代理不太好) 问了数据类型,然后就问深拷贝浅拷贝,让我实现深拷贝 问promise,让我实现all和race方法 解释下事件循环机制 nextTick 总结:还是要多写写底层源码,回答
忐忑心情接受二面。 二面面试官人很好,开摄像头了,问的问题很开放,应该是主要看思路的活跃度,很快,28分钟结束战斗,整个面试流程舒服的一笔。 记录一下,感觉从面试问题的思路来看能学习到很多东西。 1.介绍一下第一个项目的情况,用户量,主要是为了解决什么? 2.手持终端是什么?如果没有网络用什么通信?(项目特有) 3.短报文的设计和通信协议清楚吗 4.如果让你来设计一个通信协议你觉得要关注哪些点呢?
部门应该叫运营商供应部 9.12 一面 35min,对方迟到5min,没开摄像头 基本确定是挂了,校招一面问这些,怀疑在招前端科学家,AI公司就是硬气。 假如你在做一个银行项目,如何保证web安全 拿到一个前端项目,如何配置这个项目(答了prettier、eslint、husky...) 谈谈对前端工程化的理解(我觉得就是上面这些东西,对方不满意) 如何优化页面的速度(答了懒加载、CDN、缓存、虚
一面 面试官会一步一步引导, 也会给出自己的见解,体验很好 简单介绍一下自己 接口优化,讲讲背景,怎么做的 八张表同时并发去查的话,会不会对数据库的压力很大,有没有考虑这方面?数据库的负载怎么样? 什么情况会导致索引失效?索引命中的原理? select .... where b = xx and c = xx 会命中索引吗,怎么优化这个问题? 有个字段叫city,你觉得用city建索引合适吗 用单
秋招第一个意向 感恩团子! 二面和hr面感觉自己发挥得并不是很好,一度以为凉了... timeline: 两次笔试都a四道多一丁点。 8.29 一面 8.31 二面 9.5 hr面 9.7 意向 一面 60min: jvm了解哪些 垃圾回收了解哪些 主线程和另外十个线程,怎样使主线程最后执行完毕 (join、await) flink checkpoint kafka有序和不丢如何保证 算法题 链表