面试时间:30min 自我介绍 对大数据的认识? 对Hadoop生态系统的了解? 分布式数据库用过那些? HBase介绍一下? Clickhouse与HBase区别? 分布式数据库要考虑的问题有那些?我讲了讲DDIA的东西,面试官还问我在哪里看的 MapReduce介绍一下? Spark架构介绍一下,里面的进程? Flink有学过吗? 在学校遇到过什么困难的问题吗?怎么解决的?有什么收获? 反问:
四月底投的这家公司,我现在都入职实习了,才给我安排笔试,本来想着今晚打打游戏的,但一看笔试时间才一个小时就进来做一下。 单选5道 不定项选择8题:涉及Java、数据结构、大数据、数据库等 填空4题:ACID是啥?MySQL四个事务隔离级别?数据结构 问答题:JVM内存区域划分 编程题:ACM模式,合并两个有序数组
面试时间:15min 昨晚正在吃饭,接到了电话,我都没反应过来时哪家公司,还问了一遍,说是亚信,我心里还吐槽,官网投了快两个月了,咋现在才来面试。 自我介绍 都用过什么数据库,介绍一下 数据库优化方法? 实习项目都是怎么存数据的? 一道SQL题,聚合函数? Linux熟练不,了不了解Linux 三剑客? 反问: 部门业务是什么?电信数据 技术栈?Hadoop、Spark、Hive、ClickHou
面了大概一个小时,我自己生病了挺不舒服的,面完就睡了,所以面经有些地方可能记得不太全 1.自我介绍,边介绍边问 tableau中如何反转矩阵(行列交换),问这个是因为我写了我会tableau 我在介绍AB test和因果推断的时候,面试官说我们用不上这些,我们主要是做模型和算法 对实习中的ETL开发任务问了一下,然后问了一下Hive SQL熟练度 实习中是如何处理大规模的稀疏矩阵的 实习项目中的评
岗位JD看起来不像是数据科学家,而像算法工程师 一面: 深挖项目 介绍一下Bert模型 树形模型是如何计算每个特征的重要性的 对项目里用到的遗传算法深挖,问我是如何改进遗传算法的 特征选择中,前向选择和反向选择实现起来有什么区别,哪个效果更好 如何构建多模态模型 在多模态任务中,如果视觉模型的输出张量比语言模型的输出张量短很多,该进行什么操作 介绍一下transformer transformer
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习 1. 自我介绍 2.八股文 hive的数据类型有哪些 hive中计算排名前N的函数有哪些 hive的优化手段你知道哪些 遇到过数据倾斜吗 mapjoin如何开启,参数是什么 3.SQL题 rt_ data表存放了当天每半小时的店铺销售数据,表名: rt_ data,字段名: shop id (店铺id
45min 自我介绍 数仓项目的数据采集模块怎么做的 flume组成,各个模块的功能 为什么要使用这些source或者是sink file channel和memory channel有什么区别,分别在什么场景使用 flume内部原理 sink消费能力弱,channel会不会丢失数据 数千台机器需要采集日志小文件到hdfs上,该怎么办? 数千个flume要怎么统一配置,修改就分发吗? maxwel
一面8.23 1.自我介绍 2.介绍一下你做过的项目 3.从项目展开的问题:sqoop导数据是从哪到哪? 从mysql到hdfs 在导数据的过程中有没有遇到什么问题? 数据量不大,所以没什么问题 (我的项目很简单,所以我没法答啊,不过幸亏面试官没有深究,开始八股) 4.范式建模有什么特点?和维度模型的区别 (数仓建模理论在《大数据之路:阿里巴巴大数据实践》中有详细归纳,强推!) 5.三范式能说出来
4.22官网投递->4.23约面->4.25一面->5.5二面-> 面试官有事5.10三面改到5.15->三面过后接着hr面->5.22offer 快手一面(大约40min,sql写了20min) 1、自我介绍 2、hive和pyspark是学校有课程还是说自学的 3、本科或研究生期间有学过编程相关的课程吗 4、研究生学的些什么课程 5、你的项目都是自己去做的吗 6、你之前有实习过吗 7、四个SQ
我太菜了,C++需要恶补才行,面试完基本上就知道自己寄,面试官特别好给我说了很多,也让我充分认识到自己的不足 如果是项目的话,会问你项目背景以及项目最终的实现结果等等 如果是自己学习的项目的话,会问你对这个项目的学习心得 最后问对C++对掌握程度 实现vector
1.自我介绍 2.问科研成果,我就一个软著,还有一篇论文涉及机密数据不让发了。 3.说下bert和gpt的不同(论文中提到了bert) 4.说一下多头注意力(好久没复习,感觉答得不咋样) 5.问实习、问项目 6.手撕快速排序 7.反问职责,结果是收集数据、模型训练和测评都要做,那还行。 面试官超级好,有些感觉自己答得不是很好时,都会引导一下。
7.29号--一面 一个小姐姐面试 自我介绍 1.点赞幂等如何保证? 2.分布式学了什么? 3.分布式解决什么问题而提出来的? 4.做分布式有什么麻烦?需要考虑把服务拆成微服务,那么维护,设计需要考虑什么问题? 5.分布式服务数据之间的流通?(这一部分分布式确实不知道回答什么 -。-,看我不太了解分布式果断终止话题,换其它) 6.spring框架用到了什么底层思想,如何实现的,有用到哪些比较
1.视频面试介绍自己 2.你了解kotlin多少(我就学了一个月,散装的kotlin有多尴尬是多尴尬) 3.说一下kotlin的内联函数 4.聊Android项目,使用的技术栈,架构思想等等 5.说一下HashMap 6.说一下Hash冲突,怎么解决hash冲突 7.说一下java的设计模式 8.怎么停止一个线程 9.简单说一下线程池 10.聊一下你在开发中遇到的问题,怎么解决,我说了跨域问题用注
自我介绍 项目 前端or后端 springboot注解 aop 关于订单模块的幂等性 没答出来 数据库 姓名 科目 成绩 同学根据平均成绩降序排列 找出不及格科目>2的学生 (这里没答好...上来分组后就count min了 (一直引导我 应该是where 成绩<60 学生分组 count(*)>2 算法题 查找链表倒数第n个节点 答:双指针 问:递归的要素?这道题用递归呢? (这里我想了一会 出
3.21约一面 3.29一面: 主要问Java八股以及Spring框架八股,concurrentHashMap的底层实现,@Autowired注解冲突,ArrayList和LinkedList的底层实现。一道算法题Leetcode490迷宫,结束后大约五分钟约二面 3.31二面: 问了点Java基础,String,StringBuilder和StringBuffer,@Spring Boot Ap