一面 4.6 视频面 本来说好视频面,差不多晚上8点打了个电话说电话面,聊了30分钟基本没怎么问技术问题。 二面 4.10 现下面,聊了10分钟天,面试官说他搞算法的,问了个技术问题clickhouse有什么可以代替,这题没答上来。G
题型:10道单项、5道不定项、2道算法、1道SQL,难度还可以 单项题 1. 哪个程序通常与NameNode在一个节点启动?Jobtracker 2. HIVE的建表描述,错误的是:STORED AS 指定存储路径 正确应该是指定表的格式 3. 维度建模中雪花模型和星型模型的描述不正确的是:星型模型是多个事实表和多个维度表组成 正确应该是 1个事实表和多个维度表组成 4. hive中用get_js
一面 50分钟 自我介绍 你学过的大数据掌握的最好的是哪一个 hive里面排序一般怎么使用的 hive内部表和外部表的区别,外部表在什么场景下使用 hive视图用过吗 你对维度和事实的理解 你说到了业务过程,谈谈对它的理解 你刚刚描述的是一个业务过程还是 多个业务过程 多个业务过程放到一张事实表的你举个例子 维度建模中 星型模型和雪花模型 之间的区别 缓慢变化维表如何处理呢 全量表的数据保存多久
自我介绍 项目介绍:(国模详细介绍、面对的困难) 实习介绍:实习中有没有做一些本职之外的有趣的事情。怎么样对数据预处理,有没有什么提炼的策略。 nlp介绍 用户画像怎么做的 sql窗口函数三个 反问:业务、实习时间 面试官是小姐姐,感觉还挺好的:) 等一个结果
#面试经历##字节#神奇是真的神奇,刚接到电话二面过了,周日三面。 个人情况:中科大本硕 本数学 硕统计 代码能力一般 无任何实习或项目经历 详细见之前的动态。 面试官是个很严肃气场很强而且比较年轻的男性。 面试流程: 详细介绍项目。(我还是讲的课题 这次面试官问了里面的细节) 业务:有五条不同渠道来邀请新用户,试探索五条渠道预算投入的最优分配。 我答的:分别拟合五条渠道各自的回报函数f_i,考虑
一面 50分钟 自我介绍 http协议是哪一层的协议,讲一下对http的了解 tcp协议和udp协议是哪一层的协议,讲一下他们之间的区别,以及他们各自的应用场景 你知道get和post请求吗,讲一下他们之间的区别 当我们输入美团网址的时候,这个从输入到显示页面的过程 你了解操作系统吗,linux了解吧,你说一下你用过的命令 当我们要查看文件的具体属性用什么命令 讲一下静态链表和动态链表的区别 数据
光速面试,周六投周日测评周一约面 面试官人很好 两数之和 给不懂编程的人讲线程和进程 线程的状态 实现同步的方法 synchronized和lock区别 让线程阻塞的方法 让java程序结束的方法 本地fork了代码,upstream更新了,应该怎么拉取(没答上) 最近做的项目 讲讲项目遇到的难点 感觉面试官找不到问的了,项目用的SpringBoot,mybatisPlus,shiro,vue,j
3月1日晚笔试了2小时,我对Hadoop不甚了解,同时编程第一题暴力求解花费太多时间导致动态规划没有完成,寄 单选题10道,考察计算机网络、JAVA、Hadoop、MySQL等计算机基础知识 简答题3道,考察MySQL索引和优化、Hadoop大数据组件、对游戏指标的解读 编程题3道,一道Z字型变换(参考力扣第6题N字型变换),一道合并区间(力扣第56题),一道动态规划,都是中等难度 主观题2道,了
一面 电话面 40分钟 自我介绍 介绍实时数仓的项目 你这里用到了clickhouse,clickhouse的写入和读取为什么快 flink有哪些算子 flink的窗口函数了解吗 flink的精准一次性如何保证的 kafka是如何保证数据不丢失和不重复的,从生产者和消费者考虑 hbase用过吗,rowkey的设计原则是什么 如何解决热点现象 redis的数据结构了解吗 java的spring会吗
面经:主要看学历40%、项目经历30%、籍贯30%,一共17分钟 1.自我介绍 2.负责项目和擅长的编程语言(注意:项目大小由面试官判断) 3.hdfs流程 4.编程语言八股(好笑的是说python面试官都蒙,说Java才能走流程 5.项目追问 遇到问题: 1.非硕不要报,就是刷kpi的,海外本科可以报下,有点恶心; 2.非当地省份户籍的慎重,否则同样kpi,面试官比较看重这一点,对外地很会阴阳怪
3月11日笔试了90分钟,题目相对简单,大部分题目都有思路,但我的表述存在很大问题,寄 5道选择题(20分),考察统计学概念(抽样方法、置信区间、均值和标准差)、游戏指标、游戏术语 5道简答题(80分),考察辛普森悖论、SQL查询(分类统计和留存率计算)、业务理解能力(游戏指标解读)、介绍手游(概括手游特征、描述游戏系统、估算DAU和流水)、个人职业规划 牛客网上有SQL的企业真题,也有关于游戏数
1.自我介绍 2.说一下数据库范式 3.说一下Hbase 4.Hbase的rowkey怎么设计的 5.说一下Clickhouse 6.说一下你了解的数据库底层的一些知识 7.数仓为什么这样分层 8.数据表和数据视图的区别 9.实习 数仓让你觉得有成就感的地方 10.你对离线感兴趣还是对实时感兴趣 11.你知道OLAP数据库都有哪些 12.Sql题 13.Hive Spark优化掌握的怎么样? 14
1.平常是用python还是java?python和java掌握程度? 2.hadoop的组成,每部分有什么用。 3.spark掌握的怎么样,SQL练过哪些题。 4.mapreduce源码看过吗? 5.wordcount的流程。 6.Scala有没有学过? 然后开始挖简历,还问了我一些业务的问题。 说后面会通知二面,也不知道有没有...
3月底做的笔试,4月初通知面试,笔试是20道统计学题目和30道行测题目,比较简单 一面属于半结构化面试,用时30min,我对Hadoop和数据仓库不甚了解,寄 自我介绍、项目简述、职业规划 如何向缺乏专业数学知识的普通人介绍正态分布 逻辑回归模型的原理和优缺点,gbdt的优缺点,gbdt和xgb的区别 是否熟悉Hadoop、数据仓库,目前处理过最大的数据量是多少 列举SQL的窗口函数,如何提高SQ
什么是MySQL MySQL是一个关系型数据库,它采用表的形式来存储数据。你可以理解成是Excel表格,既然是表的形式存储数据,就有表结构(行和列)。行代表每一行数据,列代表该行中的每个值。列上的值是有数据类型的,比如:整数、字符串、日期等等。 数据库的三大范式 第一范式1NF 确保数据库表字段的原子性。 比如字段 userInfo: 广东省 10086' ,依照第一范式必须拆分成 userInf