一面 1.自我介绍 2.最好的项目 3.数据可视化 4.research和find 5.try except 6.数仓的架构 二面 1.自我介绍 2.如何处理异常值和缺失值 3.numpy和pandas平时怎么用于数据预处理 4. pyspark怎么处理缺失值
一面 redis: RDB和AOF的区别 AOF中记录的是什么,RDB中记录了什么 过期数据的删除策略 使用这些删除策略可能会出现哪些问题 定期删除是所有数据删除吗 内存淘汰机制 allkeys详细说说 redis使用场景 redis和memcached有什么区别 为什么用单线程不用多线程 clickhouse(实习里用的主要是这个): 简单介绍一下clickhouse,说说为什么用这个 说一下R
三一重工笔试大家都说挺简单的,还是提前批,所以最近也没抽时间来复习,直接上来裸考。 题目全是选择题,有三十道单选题,十道多选题。笔试限时一小时做完,实际上不到十分钟大部分就选完了。以下凭记忆记录几个题目,当然我也很多没做对~ 算是查缺补漏了。 1. hadoop 环形缓冲区大小? 2. spark 行动算子和转换算子识别? 参考链接: https://blog.csdn.net/weixin_
一面 聊项目 2道sql lead/lag函数 like pandas基础 数据倾斜问题 二面 聊项目 表连接方式 数仓各层作用 数仓建模类型有哪些 维度模型有哪几种 sql执行计划 mr过程 数学建模怎么分工 为什么不读研 数据中台产品了解哪些 已oc #面经#
Timeline: 9.1 投递 9.14 笔试 9.25 一面 11.1 二面 技术+HR面 9.25 一面 23min: 1.项目经历 2.数仓分层 3.数仓执行引擎 4.Sql关键字执行顺序 5.Mysql索引引擎 6.Innodb和myisam区别 7.Flink基本算子 8.Map和flatmap 9.Keyby 10.数据倾斜 怎么定位 11.Hive分区表和非分区表 12.增加或删
投递岗位:后端开发工程师(西安) 投递base:西安 投递时间线:9.19投递,10.20收到笔试邀请链接,10.23笔试 考试内容:固定时间19:00-20:10,4部分,使用国考平台,除了编程其它都部分提交完不可修改。 1.行测数学:10道,类似行测里的数学计算,感觉更简单一点,排列组合更多更难一点。 2.单选:45道,涉及数据库,计算机网络,操作系统,java语言基础,数据结构等等,有难度,
1. 自我介绍 2. 单测怎么测试? 3. 你们的代码写完之后写测试代码吗 4. 项目相关的一个重放攻击 5. HashMap,HashTable,TreeMap的区别 6. 线程安全用哪个? 7. 线程池参数和扩展过程 8. 阻塞队列有哪些? 9. 一个线程如果两次调用start方法会怎么样?(这里其实会抛异常,答错了) 10. JVM内存区域 11. 会溢出的区域有哪些? 12. 垃圾处理器有
在现公司干得有点憋屈,想跑路了,得先找一下感觉,看差点啥,再补补,明年拿了年终就可以跑了。 一上来,不多说,自我介绍。 然后介绍项目,介绍完开始抠细节: 1、团队多少人?数据量多少? 2、业务调研怎么做的? 3、如何确定主题域的? 4、怎么分层的? 5、为什么这么分层? 6、各个表抽取策略是怎样的?如何确定增量抽还是全量抽? 7、数据质量怎么保证的? 8、数据开发规范是怎么样的? 9、任务是怎么调
电信智科(中国电信股份有限公司数字智能科技分公司)-大数据开发运营工程师面经 9月1日投的,15日笔试,26日一面。这个公司是在国聘行动上投递的,在成都就这一个岗位,本来没抱希望投的,结果没想到还给面试了。面试在腾讯会议上的,一共25分钟左右,比较短;感觉有点凉,像kpi面,我准备了kafka的很多八股,结果一个没问,一直在怼网络,感觉有点像kpi面试。 以下回答绝大部分是GPT4.0回答
Electron支持Chrome DevTools 扩展程序,可增强开发工具调试流行web框架的能力 DevTools Extension Electron supports the Chrome DevTools Extension, which can be used to extend the ability of devtools for debugging popular web fra
23届春招的面经,大数据方向。希望对大家有帮助,最后对比offer选择了快手。 1.投递简历: 我是通过内推进入一面,投大厂可以试试内推,有些大厂走官网我简历关都过不了,但是内推可以🤣🤣,比如阿里我官网投递简历后就没声了,后来有人内推进了蚂蚁的一面,但当时不太想继续面了就没去。这也可能是内部系统的问题,总之建议大家多试试。 2.一面和二面面经 问的问题相似,都是大数据八股,sql,还有项目和实
# 一面4.20 电话面,当时忘了记录,一部分忘了 自我介绍 maxwell我没用过,可以简单介绍一下吗 除了maxwell你还知道哪些数据同步工具 介绍项目整体内容,技术方案和业务内容 数据倾斜的解决方案(讲了join,group by的解决办法,但被问还有没有) Linux查看文件命令 more和less的区别 udf、udaf、udtf的区别 hashmap的原理 进程线程区别 你觉得你的性
10.11 蚂蚁一面(共 20min) 电话面,随便聊了聊,说我要做笔试才有进一步进展,但我没时间做这个笔试 自我介绍 对部门业务的了解 对数据仓库的了解 询问项目具体内容 说我聊的还行,催笔试,笔试后才有相应反馈,笔试安排在10.11晚,有事没空做,再看吧 反问 部门重点在数据仓库构建还是在数据处理 #蚂蚁金服##秋招##数据#
一面 8.14 自我介绍 实习内容,没有深挖 Hive 的存储格式 orc parquet 有没有了解过Cube, grouping sets 有没有了解过 group by ,sort by,cluster by ,distribute by 的区别 Mr的工作流程 Yarn的调度框架 Hive内部表外部表区别 Lag lead first_value last_value含义 Row_numb
一面 实习深挖 聊数据治理(链路、模型、作业) spark作业调优具体案例 数据质量评价体系,如何保证数据质量 全链路数据建模怎么做 指标设计方法 数据结构有哪些,分别有什么作用 计网各层都有什么协议,分别有什么作用 mr和spark区别 shuffle原理 MySQL索引有哪些 MySQL索引数据结构 数据倾斜解决办法 算法 前k个大数 SQL 1.薪资TOP3 2.各个部门入职最早的员工 #美