一、前言 在继续阅读之前,请先思考一下是否曾经遇到过以下问题: 对大数据源码一无所知 不擅长突出项目亮点 缺乏算法刷题技巧 难以理解面试笔记V5.0中的答案 ...... 如果你曾经或者正在面对以上问题,那么面试笔记V6.0可能会成为你的解决之道 大数据开发面试笔记V5.0发布已有半年,现在V6.0终于推出,本次更新的主要内容如下: 二、核心目录 V6.0笔记包含大数据篇、计算机语言篇、计算机基础
介绍项目 说一下遇到的难点 项目的核心指标就是**的占有率吗? 怎么验证数据的准确性? 有遇到过数据对不齐的时候吗,怎么发现的。 讲一下数仓分层的好处 如果需求方想临时插一条数据进数仓,怎么解决。答找后端更新数据,我再重刷。 除了这个办法呢?能不能在数仓中直接insert一条数据。 为什么不建议直接往同一个分区追加新的数据? 为什么要选择数据开发?别人都说数据开发是sql boy,你怎么看这句话。
一面6.14 45min 挖简历项目 机器学习线性模型口诉原理(简历提到机器学习) 手写最大子数组和(ac通过),要求nlogn复杂度。(提示递归,未答出) 无八股 二面6.18 1h 挖简历项目(详细介绍项目、随口问了下springboot与jdk版本 、MongoDB原理,elasticsaerch等) 场景题:抢购平台,有哪些与异常相关的字段,比如用户订单等信息。如何设计异常检测大数据平台
2023年4月,大数据开发面试笔记V3.0发布,过去已经两个月,V4.0终于来了,这次主要新增了企业级调优手法以及数据湖基础等内容。如今面试越来越难,常常会被问到大数据的前沿知识比如数据湖,以及企业级调优手段有哪些等,于是我结合自己在大厂的工作经历进行了补充,最终汇聚成一份全面的大数据开发面试笔记。 此笔记包含大数据开发、Java、计算机基础、数仓理论、常考SQL、大数据开发场景题
在boss上投了简历,沟通之后,今天接到了可以线上面试的电话 (面试官说之前打电话都没有人接,因为之前我一直开的手机免骚扰,最近才发现这个问题,友友们记得看看拦截的设置,真的会错过面试电话) 问题(顺序有点乱,因为有的后面才想起来是前面问的) 1.自我介绍 2.介绍一下做的项目 3.项目详情 4.学校教授的课程有哪些、学python多久了、有哪些是用python的、python的基本知识 (插一个
23届春招的面经,大数据方向。希望对大家有帮助,最后对比offer选择了快手。 1.投递简历: 我是通过内推进入一面,投大厂可以试试内推,有些大厂走官网我简历关都过不了,但是内推可以🤣🤣,比如阿里我官网投递简历后就没声了,后来有人内推进了蚂蚁的一面,但当时不太想继续面了就没去。这也可能是内部系统的问题,总之建议大家多试试。 2.一面和二面面经 问的问题相似,都是大数据八股,sql,还有项目和实
# 一面4.20 电话面,当时忘了记录,一部分忘了 自我介绍 maxwell我没用过,可以简单介绍一下吗 除了maxwell你还知道哪些数据同步工具 介绍项目整体内容,技术方案和业务内容 数据倾斜的解决方案(讲了join,group by的解决办法,但被问还有没有) Linux查看文件命令 more和less的区别 udf、udaf、udtf的区别 hashmap的原理 进程线程区别 你觉得你的性
10.11 蚂蚁一面(共 20min) 电话面,随便聊了聊,说我要做笔试才有进一步进展,但我没时间做这个笔试 自我介绍 对部门业务的了解 对数据仓库的了解 询问项目具体内容 说我聊的还行,催笔试,笔试后才有相应反馈,笔试安排在10.11晚,有事没空做,再看吧 反问 部门重点在数据仓库构建还是在数据处理 #蚂蚁金服##秋招##数据#
一面 8.14 自我介绍 实习内容,没有深挖 Hive 的存储格式 orc parquet 有没有了解过Cube, grouping sets 有没有了解过 group by ,sort by,cluster by ,distribute by 的区别 Mr的工作流程 Yarn的调度框架 Hive内部表外部表区别 Lag lead first_value last_value含义 Row_numb
一面 实习深挖 聊数据治理(链路、模型、作业) spark作业调优具体案例 数据质量评价体系,如何保证数据质量 全链路数据建模怎么做 指标设计方法 数据结构有哪些,分别有什么作用 计网各层都有什么协议,分别有什么作用 mr和spark区别 shuffle原理 MySQL索引有哪些 MySQL索引数据结构 数据倾斜解决办法 算法 前k个大数 SQL 1.薪资TOP3 2.各个部门入职最早的员工 #美
本文向大家介绍详解小程序云开发数据库,包括了详解小程序云开发数据库的使用技巧和注意事项,需要的朋友参考一下 在云控制台操作云数据库,即创建数据库和插入数据等操作。 云开发数据库提供的数据类型:string、number、object、array、bool、GeoPoint(地理位置点)、Date(时间)、Null 其中的Date表示时间,精确到毫秒。小程序端用Javascript内置Date对象创
面试官提前5分钟进来了,所以就直接开始了 1、自我介绍? 2、家在哪? 3、了解惠州吗? 4、未来想在哪发展? 5、你觉得工作需要哪些能力? 我把我觉得的优点说了一下 6、你的不足。 我说了团队管理能力,但是没说好hr理解为我沟通能力不足,遂又解释清楚 7、为什么没有实习? 我说了我暑假在参加比赛和准备考研 8、考研情况。 应该是想看稳定性,我直接说专业课被压得国家线都过不了(确实如此) 9、有想
刷题刷得我迷迷糊糊的 题目 一个target字符串 一个字符数组 nums 找出nums中包含target 的最小连续子数组 输入 target = abc, nums = [c,a,c,b,c,c] 输出 [1,4] 可能是将最长公共子序列改的 #SHEIN#
小米 String 为什么要设计成不可变的? fragment 各种情况下的生命周期 Activity 上有 Dialog 的时候按 home 键时的生命周期 横竖屏切换的时候,Activity 各种情况下的生命周期 Application 和 Activity 的 context 对象的区别 序列化的作用,以及 Android 两种序列化的区别。 List 和 Map 的实现方式以及存储方式。
北京线下。奔着 KPI 面去的。 一面 - 技术面 自我介绍。 项目。 最近印象深刻的事情。 学过什么数据结构和算法,刷过多少力扣题。 实现 strcpy。看我写的慢给我打断了,问我是不是没写过。答曰是,把思路给它讲了下,并说明拷贝时可能出现的覆盖问题。 我这都能一面过?着实离谱。 二面 - 技术面 本科干了啥,研究生干了啥。 对职位什么看法?是奔着高薪来的还是啥? 拿着我的成绩单,说这成绩也不高