数仓理论,项目,问我从哪了解的数仓,我说项目学习和大数据之路,面试官笑了“谁推给你的这本书” 然后sql题 反问 实习生干什么~指标搭建,应用层简单建模,可视化 18分钟解决。。。 大厂的实习总是这么迷惑,小米按校招流程给我又是sql又是算法一顿鞭策,这个15分钟告诉我结束了,而且这位好像是负责我的业务导师。。
共两面 已G 希望攒攒运气吧.... 7月31日一面 一面共15分钟左右,面试官有事直接挂了 1. 自我介绍 2. 协程和线程 3. redis是否是单线程 之后没回答完面试官就说有事走了 8月7日二面 1. 自我介绍 2. 两道简单题AC了 3. redis单线程 4. 孤儿进程和僵尸进程
1. 自我介绍 2.简单问了一下项目,两端项目你觉得有什么不同 3.操作系统,介绍一下操作系统,你怎么看 写hello world从运行到展示操作系统都怎么处理的 4.计算机网络 ping网站发现延时过高你会在哪些方向上看待问题,怎么解决 5.数据结构 6.日常开发中java写一个递归打印hello world 然后操作系统报错,你怎么定位和排查问题(语言层面和语言底层和操作系统) 7.sql优化
4399数据分析 甚至没有自我介绍 面试官上来介绍说他是HR 内容 问最近有没有找实习 聊实习经历 优缺点 其他不太记得 应该没有很多 反问 15分钟 over
背景:985本硕,无实习,自学大数据相关技术栈,尚硅谷离线+实时数仓,实验室项目。 hdfs读写流程 mapreduce shuffle maptask和reducetask数目如何确定 小文件过多对namenode有什么影响 mr优化有哪些点 进程和线程 hive sql转换为mr的过程 离线数仓项目:项目流程,思考,价值 如何保证数据一致性 如何衡量两个数仓的优劣 两道题: 1-1000的递增
自我介绍 讲一个重要的项目,针对项目提问。 sql题 Python题(面的时候没想出来,面完就知道怎么写了,服了😅) 反问 一共35min,这不是纯纯kpi吗 #数分# #秋招#
一面 8.14 自我介绍 实习内容,没有深挖 Hive 的存储格式 orc parquet 有没有了解过Cube, grouping sets 有没有了解过 group by ,sort by,cluster by ,distribute by 的区别 Mr的工作流程 Yarn的调度框架 Hive内部表外部表区别 Lag lead first_value last_value含义 Row_numb
是脉脉这个公司的面试,不是脉脉上投的公司的面试。 虽然没想去,但我感觉也没资格去 面试官一直在说不做评价,不做评价,懂我意思吧。 问了java、jvm、scala偏函数 大数据问了kafka选举流程;yarn调度器;zk。哪不熟问哪,反其道而行。 偏底层组件开发,我可能偏数仓吧,技术力还没到这个程度。问的有点怀疑人生 面试官结束直接告诉我今天到这了,我说问问题呢问问题,他说理论上实习生没有提问环节
Discover数据分析一面 - Phone Interview - 全英文 手机开了自动拦截垃圾电话,前面几个电话没接到之后才反应过来关了。(被假中国海关的诈骗电话骚扰无数次) 1. 自我介绍 2. 最喜欢的课程,为什么? 3. 怎么知道Discover和这个工作的? 4. 有在信用卡领域的工作经验吗?(没有,只知道刷卡😂) 5. 对简历一个项目详细介绍 6. SQL where和group
整体的面试内容会结合项目和实习经验进行提问,面试官人很好,问题也是由浅入深。 有监督学习和无监督学习的区别 过拟合的处理方法 梯度下降法原理 损失函数作用 实习的主要内容 ES中索引的类型和作用 ES的优点 mapreduce的原理 还问了一些数仓的知识 没答上来 数学建模 模型的类型(记得好像是这样 一道简单算法题 反问
部门是:内容安全风控 写个面经 攒人品让我进三面吧 一面8.5 面试官没开摄像头 1.自我介绍 2.实习经历深挖 3.从用户和内容维度搭建指标 4.sql 如何监控平台安全健康(自己给字段,sql说思路) 5.反问 一面大概半个小时,以为挂了,8.9通知8.12二面(三个工作日,还挺快) 二面8.12 面试官开摄像头了 1.自我介绍 2.两段实习经历深挖 3.一道概率题 A、B服从U(0,1),求
10选择 5填空 基本都是计网、数据结构 1简答 设计一个业务数据管理系统 1编程 求回文子串数量 专业性不强感觉全是八股
时间:120min 选择题:Hadoop+Spark+Linux+408 编程题: 小红的不动点:直接用HashMap就行 每个部门薪资排名前两名员工:rank开窗 小红删数字:这题应该是后端笔试的第二题,逆序dp,只过了96%
第一题100 求不动点个数 如果元素值等于其在数组中出现的次数就是不动点 哈希表做 map存元素值及其出现次数,再遍历key判断key是否与相应value一致. 第二题100 sql rank窗口函数 需要注意的是不能用dense_rank和row_number 过滤条件窗口列rk小于等于2 否则结果不一致 第三题0 没时间写了 看了一眼可能要用动态规划? 求求了给个机会吧 第一次写出来这么多
数据分类 对一个数据a进行分类,分类方法为:此数据a(四个字节大小)的四个字节相加对一个给定的值b取模,如果得到的结果小于一个给定的值c,则数据a为有效类型,其类型为取模的值;如果得到的结果大于或者等于c,则数据a为无效类型。 比如一个数据a=0x01010101,b=3,按照分类方法计算(0x01+0x01+0x01+0x01)%3=1,所以如果c=2,则此a为有效类型,其类型为1,如果c=1,