1.自我介绍 2.大数据项目battle 3.对于窗口函数的了解 有什么,什么场景,怎么用 4.文本拼接函数是什么 5.hbase负载均衡怎么实现 6.cv项目battle 不同模型的区别 网络+部署 7.反问 京东商城核心检索业务 和leader讨论面试结果,一周内hr会联系
20分钟左右。三个面试官。 数据增强,boosting,bagging和stacking区别,超参数调优什么的,基本都是项目相关的机器学习的内容。hr问期望地点,对部门的了解,还具体问了我本科时候发的论文,说是闲聊。希望能过 #建信金科#
社恐鼠鼠第一次参加群面,属于是开眼界了,这次面试见识到了好多优秀的人,而且因为线上面试,大家都开着视频,大家颜值都很好,光鲜亮丽,好几个都穿了正装,就鼠鼠我随便穿了件T恤短袖。 一共一个小时多一点,一个hr面试官,10个人一块面试,五个问题,三个必答,两个选答,选答问题大家都是抢着发言。 1.必答,你们对中金公司的了解是什么,为什么选择投递中金; 2.选答,数据分析在中金公司如何发挥作用; 3.必
1.自我介绍 2.介绍和数据相关的项目 3.深入探讨项目 4.左外连接(口述他提供的场景结果) 5.你的数据表中常用哪些索引 6.查询和索引是有关的吗 7.优化慢查询 explain 看哪些信息?实际操作过吗? 全程就是索引相关的问题,和看到的完全不一样,准备数仓的概念都没用到
面的很快,20min不到就结束了 自我介绍 项目用到了哪些技术 说一下mysql,redis,mongodb的区别 redis做缓存数据丢失怎么处理 redis持久化 如何做到数据完全不丢失 mysql和mongodb的持久化底层机构是什么 java序列化 如何使java类序列化为json 不使用库如何实现(类内没有函数) 为什么不继续研究生的科研方向 为什么选择去成都 反问: 这轮就是终面,后面
1、 项目一直挖 2、 Spark调优 3、 Shuffle之类的优化 4、 平常写SQL注重优化之类的问题 5、 第一道题让看下面Java代码写输出。 private static void test(int[] arr) { for (int i = 0; i < arr.length; i++) { try { if (arr[i] % 2
1、 确认专业,保研,成绩,排名 2、 课程内容,研究生课程等 3、 数据库底层索引的优劣势? 4、 我现在有一张表把所有字段都加索引了,这样好吗? 5、 存储过程和视图? 6、 视图字段是单独存储的吗? 7、 MR原理用你自己话简单描述。 8、 MR中数据倾斜的产生情况,你如何解决? 9、 一个复杂的SQL中发生了数据倾斜,你怎么确定是哪个group by还是join发生的? 10、 count
数据库底层索引的优劣势? 数据库底层索引的优势和劣势主要取决于具体的索引类型和使用场景: 优势: 提升查询性能:索引可以加快数据库的查询速度,通过跳过不需要的数据块,减少了磁盘I/O操作。 加速排序:索引可以帮助数据库对查询结果进行排序,从而提高排序的效率。 支持唯一性约束:索引可以保证某一列或多列的唯一性,保证数据的完整性。 提高并发性能:索引可以减少数据的锁竞争,提高数据库的并发性能。 支持数
互联网: 京东物流-数据研发工程师-离线数仓(8.14 16:00) 一面30min: 1.数仓分层 2.数据治理 3.业务使用的内部表和外部表 4.数据倾斜是怎么处理的 5.三道sql(join,group by,rank窗口函数、ddl语句删表和删分区) 快手-主站-数据开发工程师 一面(通用面)-40min(8.17 11:00) 1.介绍美团项目 2.数仓分层 3.join的mr过程 4.
提问环节: 说一下你对DBA这个岗位的理解 你熟悉哪些数据库类型 MySQL有哪些索引类型 普通索引和主键索引的区别,它们在数据结构方面的区别 事务的隔离级别 事务的ACID原则 说一下事务的持久性 MySQL的安装过程(安装包类型) 如何查看linux系统的剩余内存 查看linux的负载情况 查看linux某个文件夹的大小 Python有哪些数据类型 列表和元组的区别 Python中装饰器的概念
思特奇一面 19min(已进终面)总体来说不难,但是网上风评不太好 1. 自我介绍 2. 介绍一下你在实习中用到最多,掌握最好的技术? 3. 介绍一下你项目中,从数据采集,到数据加工到标签生成,整个流程能介绍一下吗? 4. 标签用什么语言开发?能简单介绍一下hive吗?hive的分区?hive表能单条删数据吗? 5. 你能说一下hive sql的性能优化吗?参数+代码 6. 说一下你的比赛内容?你
1,自我介绍。 2,两端实习经历详细讲讲。 3,事务的隔离级别。 4,sql中文乱码,怎么解决,更改编码的命令。 5,sql中日志相关。 6,查询内外连接,查询优化。 7,反问。 8,是否接受调剂?是否了解银行和子公司?
10.16投递 10.17一面(50minute) 自我介绍 项目细节 mysql(这里问了很多) 大数据的基本八股 计算机网络tcp 一道sql题,一道算法题 (吐槽一下百度的如流,用网页端看不到聊天框,最后还是下载了客户端才看到,面百度的小伙伴记住面试了要下载如流) 反问:问了一下业务 10.19二面(30minute) 自我介绍 项目细节流程 两个项目的关系 为什么不继续做大模型 实习多久
写在前面:这段时间经过了一段高强度笔面,但还是颗粒无收 面试 面试官进来就说:你不会flink? 我:了解的不多 那我们这次可能通过概率不大,但我们仍然可以就大数据来一波交流 实时: Flink的checkpoint Flink的反压 Flink的状态后端 离线: Kafka的有序性(不可全局有序,但可分区有序)面试官说不对??我让他下去再好好看看 Kafka一定不会丢数据嘛? Spark的内存模
1.自我介绍 2,实习内容 如何实现数据同步 数据同步过程中遇到的问题有哪些 数据同步过后有没有进行验证 你自己设计数据同步系统要注意哪些问题 3,mybatis 与mybatis -plus 的不同之处 4,mysql 怎么优化 对mysql 的看法 5,手撕删除链表的第n个节点 6,jvm了解吗 7,springboot 有看过源码吗 8,动态代理了解吗 感觉不太妙 像是kpi面一样 竟然没有