1轮面试 5.13下午三点面试 1.自我介绍 2.实习项目深挖,好像也没问很多 (实习的经历和数分并不是很相关,偏算法) 3.比赛项目深挖 数据有哪些特征,用了什么模型,xgboost原理和rf的优缺点 4.反问 总得来说好像并没有问很深很难的的问题 二轮面试 一面面完五分钟内就通知过了 四点半开始(效率感人😂) 1.自我介绍 2.base,投了哪些公司,有什么offer(可能比较关注意向度)
SystemTap支持关联数组。关联数组就像其它编程语言中的map/dict/hash,你可以把它看作由互不相同的键所组成的数组,每个键都有一个关联的值。 关联数组需要定义为全局变量。访问关联数组的值的语法跟awk类似,就是array_name[index_expression]。 这里的array_name指关联数组的名字,index_expression指数组中某个唯一的键。比如在下面的例子中
离线数仓项目介绍 hdfs读流程 hdfs 中datanode怎么与namenode交互 mr过程 hive数据倾斜,介绍原因和解决方案 介绍一下网络结构,tcp在哪一层 java有哪些集合类 介绍java接口 MySQL索引 数据结构(B+树) 反问 上海银行数仓技术框架
一面 38min 有序数组,求target的index(二分) 求name重复次数大于3的人的信息 对每个学生按照成绩进行排名,并标注rk, 这里我把是row_number,rank,dense_rank都说了一遍 spark的任务提交流程 索引的原理(有没有老哥有具体的博文解析啊,感觉这个一直答不好) hive如何阻止数据倾斜 kafka可以读写分离吗 为什么不可以 二面 (凉面)20min 为
单选+多选+判断+一道sql+一道编程 数据库 加密算法 tomcat三大组件 中央银行 线性结构 operator new() 七层模型 金融知识(瞎猜)
刚笔试完,赶紧写一下: 一共五道题: 第一题:sql:求平均分>60的人的id 第二题:sql:将行列转置 第三题:python伪代码:写一个生成符合分布的随机数伪代码 第四题:用极大似然估计法完整的推导逻辑回归的对数函数 第五题:切比雪夫的不等式证明 以及切比雪夫单边的不等式证明
嘉银金融数分笔试,是真的各方面都覆盖了 概率论、机器学习、sql 好像没有考python 概率论:全概率公式、贝叶斯公式(是一个简答题),选择题里面也有概率论的,就是算一些类似取球的概率题 机器学习:SVM、随机森林、Xgboost的一些优劣势、还问了有哪些集成学习算法(这个是简答题) sql:一道sql题:求地理成绩top3的学生信息 记不清楚了,大概就是这些了 总体上是选择题和简答题(4道,一
两个简单的sql,1个编程 2个概率论推导
一面(11/3) 自我介绍 拷打项目 然后问了一个Flink反压的问题 二面(11/10) 自我介绍 拷打项目 问了前端展示大量数据,如何考虑?(可能大佬就是前端的) 问了用了哪些数据库? 问了Kafka 和 Flume 的应用场景? (可能时间比较紧张,所以问的比较急,二面没有遇到反问环节了)
我有两个数据帧df1(Employee表) 和 在我连接了df1.dept_id和df2.id上的这两个表之后: 同时将其保存在文件中, 它给出错误: 我读过有关使用字符串序列来避免列重复的信息,但这适用于要对其执行连接的列。我需要对未连接的列具有类似的功能。 有没有一种直接的方法可以将重复列嵌入表名以便保存? 我想出了一个解决方案,匹配两个df的列,并重命名重复的列,将表名附加到列名上。但是有直
40min 1面 自我介绍 项目介绍 做题:一道算法, sql2道 数据库索引有什么用 索引失效的情况 spark提交作业的流程 spark 共享变量有哪些 广播变量怎么实现的 hive外部表和内部表区别 hive优化,项目中使用到了哪些,展开讲讲 kafka是读写分离 为什么不做读写分离 mysql事务 40min 2面 自我介绍 项目介绍 算法题(20min) hard plus 没写出来最优
上来先做了一道 最近登录日期 的sql题 然后开始问大数据八股,,,, 1. mapreduce map端的shuffle过程 2. spark stage 划分的依据 3. 宽依赖和窄依赖 4. 了解kafka吗 5. spark sql与mysql sql的区别 6. spark dataframe 和dataset的区别 7. 数据库中id设计 除了uuid和时间戳,还有什么方式 #招银网络
北森的题库,专业部分考了机器学习算法,数据分析算法,时间序列,SQL选择题 后面还有四个大题,分别是: 1.协同过滤 2.用户画像 3.数据预处理 4.给图表,给出解决方案 没有编程题,谢天谢地 还有十几道金融题,反正我是不会。。。。
一、选择题 总计20道 408内容+大数据相关 有单选,也有多选 二、编程题 两道很简单,第一次笔试AK 第一题:随机播放器 直接用queue搞定 import java.util.LinkedList; import java.util.Queue; import java.util.Scanner; public class Main { public static void ma
本文向大家介绍ABAP 内联数据声明,包括了ABAP 内联数据声明的使用技巧和注意事项,需要的朋友参考一下 示例 在某些情况下,可以内联执行数据声明。