首先做了三道SQL题,主要涉及分组聚合、窗口函数。 3.3 一面 28min: 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min: 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran
时长:1h 由于问题太多,分四类进行整理 0. 实习相关:之前有数据开发的实习经验,就问了之前工作有没有spark或者hivesql优化的经验;如何确保数据的有效性;实习公司数据存储格式(Parquet),还知道哪些数据存储格式 1. 大数据相关问题:为什么Spark比MR快;对Spark的了解;两个表join的优化方法(大小表join可以map-side join, join前过滤null值);
#暑期# #投递实习岗位前的准备# 3月23日--分享个经验,求个好运 时长一个小时二十分钟 自我介绍 因为学统计的,问了中心极限定理和大数据定律 机器学习-XGBoost算法简介 两道智力题:逻辑判断谁说谎了和分金条 问了为什么研究生跨专业保研了? Hive和MySQL区别 数据库的索引有什么用 说一下索引的类型,还有B+树索引 数据仓库和关系型数据库区别 Hadoop生态圈简介 问我SQL写的
11.21一面:一小时左右 * 自我介绍 * 项目有哪些难点,怎么解决 * 为什么用elasticsearch搜索? * 倒排索引在内存中的结构是什么样子的? * 搜索出来的排序依据是什么? * 服务降级是什么? * 你什么时候会进行服务降级? * tcp三次握手 四次挥手? * ping命令在哪一层? * 虚拟存储器的原理? * 进程的通信方式? * Linux的管道通信用过吗? * Linux
数据结构 1. 优先级队列是否了解?说一下特性和实现原理? 2. 除了红黑数以外还有什么平衡树? 3. 堆的左旋和右旋操作你了解吗? 操作系统 1. 进程和线程有什么区别? 2. 为什么线程更高效? 3. 为什么多线程会有线程安全问题?如何解决? 4. 说说你对锁的了解? 5. 进程通信之间的方式? 6. 什么是僵尸进程?会占用CPU吗?如何回收? 计算机网络 1. HTTP 的协议有哪些常见的方
1.问项目 2.数据倾斜,spark,hive,问的比较多。大多是简单的八股 3.问java很多(没复习,哭死) ①java的多态是怎么实现的、 ②java泛型了解吗 ③java反射了解吗 ④java垃圾清理机制是什么 ⑤java多线程了解吗 直接一问三不知 4.sql现场写代码
1、自我介绍 2、聊实习 3、c++程序从编译到可执行文件的流程 4、c++11新特性 5、析构函数为什么要加virtual关键字 6、了解go语言嘛,go中协程和线程的区别 7、redis的两种落盘方式 8、redis如何保证高可用的 9、主从模式中如何选举出主节点 10、redis与mysql如何保持一致的 11、redis过期key是如何处理的 12、mysql索引类型有哪些 13、聚簇索引
到家事业群 流程:笔试 + 两轮面试 bg:成都某不起眼双非本科 + 零实习经历 一面(35分钟)3.22 自我介绍 拷打项目(跟着网上随便做的一个) 一道middle算法题(树转链表) Redis常见的数据结构 SDS的结构设计 skipList的结构设计 缓存雪崩、击穿、穿透 常见的一致性保证策略 MySQL事务隔离级别以及分别解决了什么问题 Mvcc是怎么解决幻读和不可重复读的 MySQL锁
自我介绍后根据我的项目问我了一些问题,虚拟列表,懒加载,canvas怎么压缩的(这个没答对) 项目怎么实现鉴权的,我说的jwt,巴拉巴拉 然后又问了cookie, 问了防抖节流 项目跨域是怎么解决的(项目上线后用反向代理不太好) 问了数据类型,然后就问深拷贝浅拷贝,让我实现深拷贝 问promise,让我实现all和race方法 解释下事件循环机制 nextTick 总结:还是要多写写底层源码,回答
自我介绍 项目中mysql表分区讲一下 分区后,范围查询是怎么个情况 分区后,底层不是多个idb文件,那多个idb的事务怎么保证 MYSQL相关优化——答了建索引、避免回表查询 回表查询讲一下 加索引的原则 联合索引的先后顺序 索引下沉了解吗 Mysql怎么解决幻读——mvcc、间隙锁 https://blog.csdn.net/m0_71777195/article/details/128075
一开始先让我做了个自我介绍,然后问我擅长哪门语言,然后让我用C++做了两道题目。第一道是关于单例模式的一个懒加载写法,具体要求是构造一个类,要求写一个成员函数Print用来打印这个类对象本身的地址;第二道关于指针,具体题目是删除当前链表倒数第n个元素,写完之后让我解释代码。这个题目其实比较好做,但是我有点忘记链表结构是如何定义的了,有点不熟。之后问了我关于项目的东西,问的很细致,就是看我是不是真正
1、自我介绍 2、介绍项目 3、controller层web路径访问顺序,前后端的交互流程 4、Dao层涉及的文件 5、mapper和xml文件,怎么关联的 6、怎么理解运用数据库的,举生活例子或代码说明 7、一段代码中,先删a表再删b表有无影响,两表是无关系的 8、实现某一事务的流程所需步骤 9、SQL题:具体用户记录唯一的表中,初始化时用户却产生多条记录,怎么删除多余的(只保留任意一条) 10
一面(1.12 75min) 主要问一些C++八股:智能指针、map和set、重写重载和隐藏、左值引用和右值引用、虚函数、C++新特性、OS虚存管理等等; 编程题:二分查找+反转链表; 项目:高并发优化的方法、redis; 反问:部门的业务,实习生的职责和成长空间; 二面(1.18 45min) 只聊了项目,主要是给出了一些业务场景让你说出自己的思路; 反问:部门技术栈,实习工作时间和地点; 三面
1. 自我介绍 2. 科大讯飞比赛做了什么,是用到了讯飞平台的某些功能吗 3. API开放平台详细介绍一下 4. 但是你做的这个接口调用具体收益,作用是干嘛的呢 5. 接口调用高并发情况时用户使用延迟之间如何进行优化 6. 用户访问时的延迟黑洞是什么,如何优化 7. 软引用、弱引用分别是什么 8. 如何提升系统的处理能力,如何优化 9. 手撕: 1. 多线程去查询数据库,并将查询结果放入List<
项目 1. 两个项目是自己写的吗? 2. 对哪个项目比较印象深刻?聊聊有哪些难点?(聊的短视频项目) 3. 你提到高并发与分布式,详细展开讲讲。 4. 服务拆分的依据是什么呢? 5. 网关用的是啥?了解Nginx吗? 6. 你提到反向代理,它和正向代理有什么区别?(答得一般❌) 7. 我看你设计了表结构,那你谈谈平时设计表结构有哪些注意点? 8. 短链接项目是做什么的?介绍一下 9. 重定向到新链