自我介绍 专业课程、成绩 是否学过计算机专业课(408) 线程、进程的区别 编译型语言和解释性语言区别、使用场景 计算机32位、64位存储空间多大 Java内存存储 Linux通过文件名、文件内容查找 介绍Redash 比较ClickHouse、Doris和Mysql架构、使用场景和优缺点 b+树的优势 实习主要工作 反问: 如何使用好一个数据模型 对我的建议
自我介绍 深挖实习经历 (介绍实习主要工作、场景复盘等等延伸) hive相关 (hive原理、hive sql区别) 数据倾斜的常见case ClickHouse相关 group by原理 left join与right join区别与特点 主要技术栈 对岗位的理解 反问: 部门与产品业务线 校招生定位
自我介绍 实习工作介绍 事实表与维度表如何搭建 星型模型与雪花模型 维度冗余 业务场景理解 数据倾斜原因和常见手段 手撕 一道sql: 连续登录7天用户 两道算法: 二维动态规划 n! 尾数0的个数
4.27 1h B2B,百度电商部门 介绍完自己直接开始写算法题 随机数据的峰值,如 1 2 3 6 5 8 7,返回 6 或 8都行,要求时间复杂度O(lgN) 斐波那契数列,要求时间复杂度O(lgN),矩阵解法 求两个字符串的最长公共子串,如 abcedfgh 和 bcedgh 最长公共子串是bced 求两个字符串的最长公共子序列,如 abcedfgh 和 bcedgh 最长公共子序列是bce
一面 8.30 50min 1.java常用的容器,数组和链表区别?hashmap,put的过程 2.解决hash冲突的方式?(开放定址法(线性探测法、平方探测法前后寻找)、链地址法、建立公共溢出区) 3.上面解决hash冲突引出了threadlocal,threadlocal为什么需要要用弱引用?(把源码从头到尾讲了一遍,面试官说理解的不错) 4.AQS用过吗?提供哪些接口? 5.TCP、Ip
40min 面试官问的很细,来自数据平台,技术感觉很强很全面。 warm-up 自我介绍 有其他意向吗?能来北京吗 挑一个做得好的项目介绍下全流程 难点在哪,讲一下 ElasticSearch ES有用到集群吗?有设置分片吗?有设置副本吗?副本数是多少? 你是怎么建立索引的?为什么这么建立索引? Hive 离线处理有用过Spark 吗?没有,主要用的是Hive 说一下Hive 构造UDF 的过程?
1.自我介绍 2.一周能实习多少天 3.是否考研,为什么不考 4.linux基本操作 5.手撕SQL,没答上来。请求提示,有个函数没听说过。 6.在学习的时候哪里用到了SQL 7.MySQLDDL是否了解(太紧张突然想不起来DDL是啥了,就说了没有。。),结束那一刻我才反应过来,麻中麻。。 8.反问环节 hr挺和蔼的。但是我实在又紧张又菜。。估计是凉了。 过两天还有百度的面试,更是重量级,看到自己
0:自我介绍必不可少的 1:数仓的数据从哪里来的?多少数据? 2:数仓分层 3:DWD层如何保证和ODS层的一样的数据粒度,如何提供数据质量保证? 4:什么阶段进行数据清洗? 5:数据量很大的时候每层都进行数据清洗吗?如何解决 6:ETL过程中,数据出现问题了如何预警? 7:团队合作的时候如何保证数仓分层的规范? 8:Hive的调优(项目写到了这个) 9:什么是zookeeper? 10:zook
投nlp挂,转岗大数据开发 一面 算法题:一个只包含1,2,3的数组,排序使得3在最前,2在中间,1在最后。要求时间复杂度O(n),空间复杂度O(1)。 用双指针,类似快排的思路。 二面 算法题:数组中,第一个非0的数位置索引,时间复杂度O(log n)。 二分查找。 两个面试官都很nice,没有因为岗位不匹配为难。#我的秋招日记#
发帖求好运 部门:基础研发平台-数据科学与平台部 --------- 一面:57min 1.自我介绍; 2.讲最熟悉的项目; 3.爬虫遇到的问题,如何处理的呢; 4.mysql:left join \ right join \ full join,用一个案例讲一下; 5.数据仓库了解吗; 6.Hashmap的原理了解吗; 7.Hadoop了解吗; 8.NameNode了解吗; 9.HDFS为什么安
面试问题: 1. 从8个外观相同的球里找出质量不相等的球。器材:一个没有砝码的天平;要求:几次称重后肯定能找出来。 2. 在离散的二维平面图形中,面域由三角形组成,用数组存储每个三角形的顶点,如何找出处于边界上的边; 3. 智能指针的作用和原理;
9.11 一面 35min: 1.自我介绍 2.专业介绍 3.Mysql索引 4.Mysql事务并发导致的问题 5.Mysql两种引擎的对比 6.Hadoop运行模式 7.job tracker 作用 8.Hdfs小文件问题 9.Hadoop调度器 10.Hadoop脑裂出现的原因 11.Kafka 怎样保证不丢数据 12.Flink task和subtask 的区别 13.并行度和slot的关系
#浪潮25提前批# 时长10分钟 1.为什么投数据岗 2.了解和使用过哪些数据库 3.如何提高MSQL查询效率 4.接触过python脚本吗 5.python中的命名空间是什么 6.java开发过程中遇到最多的报错是什么 7.数组越界产生的原因,如何解决 8.空指针在什么情况下会产生,如何解决 9.equals和==的区别 10.还有哪些方面的知识想更多学习一下 11.对大数据比较感兴趣吗
前言 百度上一个部门面试挂了之后,又联系了其他部门的面试,结果还是一面秒挂 一面(2月9日,1h15min) 自我介绍 闲聊(10min) 手里有没有其他offer? 三方有没有签? 为什么秋招不去签一个保底的? 还有其他一些话题 实习经历(20min) 介绍一下每段实习主要做的项目? 介绍一下每段实习的项目难点和技术栈? 其他一些实习项目问题 JVM 什么是类加载? 讲一下类加载的过程? 讲一下
1.问项目 2.数据倾斜,spark,hive,问的比较多。大多是简单的八股 3.问java很多(没复习,哭死) ①java的多态是怎么实现的、 ②java泛型了解吗 ③java反射了解吗 ④java垃圾清理机制是什么 ⑤java多线程了解吗 直接一问三不知 4.sql现场写代码