2023/10/10 平安科技 大数据开发(37min) (1)自我介绍 (2)对于平安科技的数据开发岗的理解和认为它是做什么的?和自己的契合度是怎么样的? (3)数据库学习到哪些东西,学了多久,什么时候学的,有实践过吗? (4)sql分哪几类,违反主键约束会出现什么问题,索引什么情况下回失效,有自己去安装过吗?(之前没准备数据库的内容,答得很差,后边的面试才好好看了数据库的东西) (5)使用sq
1.自我介绍 2.描述一张表的设计流程 3.针对简历提问,问的不算难 4.kafka的用法及途径 5.redis的几种类型(我有写,但是忘了), 6.有没有bi可视化经验。 ----------------- 是的,没有看错,简历上写的就会可能提问,并不会针对你。
【30min】自己提到推荐领域和数据挖掘领域,直接就问了两个领域比较熟悉的算法有什么,大概介绍一些 不会的: 1. XGB shrinkage 2. FM 算法为什么时间不高 3. 如何将用户之间和物品之间的特征加入协同过滤中(随便说了,特征拼接) 比较明确的问题: 1. 随机森林,提升树的区别 2. 随机森林如何构建?特征采样的好处 场景题 1. 给出手机的BOM结构图,对于预测手机销量和原材料
1.自我介绍 2.实习介绍 3.实习工作内容下游使用方主要有那些? 4.AI团队数据支持 他们使用这个数据做的什么 5.除了对表的支持之外,是否在计算层面做过一些优化 6.boradcast join和sortmergeJoin的区别和 使用场景的不同 然后面试官开始说,我觉得概念你应该都会,我就不问你了,所以我后面会从场景的角度去考验你的技术理解,本人听到这里心凉了半截,因为两段实习全是离线,这
HDFS是整个大数据架构的底层,它提供了一个文件系统 Spark(Spark core(RDD)) 和 MapReduce 是一个层级,是一种操作计算框架,MapReduce相当于一个别人写好的 java程序,它并不需要在服务器上启动相应的服务,甚至可以在本地run Hive => MapReduce Hive 操作MapReduce(底层是 MapReduce) Spark SQL=> Spar
已挂 一面 没有自我介绍,直接开问; 八股考的比较多,论文和实习经历都没怎么问 lgbm和xgboost的区别 RNN, GRU, LSTM之间的差别 为什么RNN容易梯度爆炸? 进程的通信方式 介绍下进程和线程 进程是操作系统资源分配的基本单位,而线程是处理器任务调度和执行的基本单位 死锁的四个必要条件 互斥条件:一个资源每次只能被一个进程使用; 请求与保持条件: 一个进程因请求资源而阻塞时,对
110分钟,全程无项目和算法,全是八股深挖,被拷打惨了 1、谈一谈你对java面向对象的理解,什么时候用接口,什么时候用抽象类,从本质上讲一下区别? 2、都有了解过哪些设计模式?创建对象的设计模式有哪些?工厂模式和建造者模式分别在什么场景下使用,举一个具体的例子 3、java的hashmap在1.8之前链表中采用的头插法的方式,为什么1.8之后改成尾插法?头插法的方式可能会极限情况连成一个环,举一
1.自我介绍 2.MySQL的事务隔离级别,慢SQL排查 3.Redis持久化AOF RDB 、集群、哨兵 4.HashMap 5.线程池
7.11一面: 1.自我介绍 2.拷打项目,项目遇到的难点,怎么解决的。 3.数据倾斜 4.数仓分层怎么做的以及作用 5.对数仓的看法 6.小文件的危害 7.介绍一下yarn 8.java三大特性 7.12二面: 1.自我介绍 2.拷打项目 3.拷打论文 4.实习遇到的难点,怎么解决的 5.一道简单sql 6.能实习多久
腾讯二进宫,秒挂,简单题没写出来,太菜了。。。 自我介绍 项目相关 介绍一下java的反射 介绍一下mysql引擎 MyISAM引擎什么时候用 讲一下垃圾回收 讲一下集合 讲一下hashmap 算法题:大数翻转 (乐死了,这么简单的题没做出来,我转了字符串双指针超时) 反问: ∽具体有什么业务 提供大数据内容服务balabala ∽技术栈有什么 大数据开发岗spark之类,后台开发岗golang
👥 面试题目 1. 字符串串池复用判断题 String str1 = "abc"; String str2 = new String"abc"; String str3 = "abc"; 2. try catch finally的作用;finally一定会执行吗? 3. Exception &error的区别 unchecked
1.自我介绍 2.实习最大收获 3.odps平台的性能调优与spark的性能调优的共同点和差异点 5.spark的countdistinct算子优化 6.bitmap作用在expload的作用是什么? 7.小文件过多的影响 8.sql countdistinct优化代码手写 9.反问 #大数据开发##数据人的面试交流地#
对Hadoop的了解 MapReduce的工作流程 虚拟内存的工作原理页面置换算法(LRU、FIFO、LFU、最佳置换) Hive的功能和优点常见的数据结构(数组、栈、队列、链表、树、图、堆、散列表) 堆的概念及分类常见的排序算法(冒泡排序、选择排序、快速排序) 平衡二叉树的定义查找平衡二叉树节点的时间复杂度
一面——60mins 自我介绍 拉链表的制作,数据量有多少,为什么不用快照表呢 项目有哪些表 数仓分层有哪些,具体做了什么,数仓分层作用 怎么设计表,怎么建模,DIM DWD层的主题分了哪些 如何做的可视化 什么是数据倾斜,数据倾斜的解决方案 Hadoop和spark的区别 Spark的shuffle流程是怎么样的 对哪些数据库了解 Shuffle有哪几种类型 在shuffle的过程中会进行排序吗
分享一下今天的面试情况,总体其实不难,但真的太过紧张,发挥极其不好。 首先上来是一段自我介绍,然后闲聊一些我的能力还有个人对于科研的看法,以及导师的管理松紧。 之后就是正式的面试内容: 1.TCP为什么要三次握手?这个题太经典了,想必背过八股的都知道,但我真的太紧张,完全不知道从哪里开始说起,所以结结巴巴的搞完了。 2.线程和进程的区别?这个也很简单对吧,不过我感觉我说的不够全面。 3.Mysql