1.自我介绍 2.数据仓库和数据库的区别 3.数仓的架构 4.分层 5.维度建模步骤 6.缓慢变化维 7.如何处理缓慢变化维(拉链表的设计) 8.通过拉链表如何获取某一天的所有用户状态 9.采用什么方式做数据的采集 10.数据哪来的 11.数仓最终的可视化怎么做的 12.OLAP引擎 13.如何评判数仓建模之后模型的优劣 14.用户分层的几种方式(交易链路,漏斗转换) 15.描述一个实时处理场景,
问题描述: 有一张tmp表,字段分别是 开始时间start_date,结束时间end_date,欠费金额amount 输出描述:用户每天需要还的金额 分析:根据题目描述的输入输出,很容易知道思路哈,就是想要把从开始时间到结束时间的每一条数据都拆开存储,然后根据日期去聚合就可以得到每天的欠费金额了,所以难点就在于如何根据一个起始时间来进行拆分呢? 一行转多行,让我们可以想到的就是使用炸裂函数expl
参加赛意在本校的校园宣讲会,投了简历,然后进行了一面(现场投简历的都可以参加面试),一面有两位面试官,一位负责收集基础信息,另一位面试官负责面试。一面之后两天内出结果,进行二面。二面之后两天内出结果,本来是约好的时间,但是老是更改,时间也定的很模糊(上午/下午),(就这一点来说有点不靠谱)。本来二面结束说好谈薪的,结果突然加了一个三面,等了一天没等到谈薪电话,突然通知三面(离谱了)。 一面:数据库
写面经攒人品,同时也是对自己的实习面试的一个记录吧 1.介绍项目,因为是密码学项目,面试官可能不是很了解,但是抠得很细,一直问到他大概明白是做了什么为止 2.智能指针 3.协程 4.Java线程池 5.Redis布隆过滤器 6.数据结构中序遍历 7.有没有在C++中引用过第三方包 8.手撕算法:给一个数字串,相邻两个字符相加为10可以消去,问最终字符串长度 9.介绍了一下所接触过的其他加密算法 面
#牛客解忧铺##牛客在线求职答疑中心##你觉得今年春招回暖了吗##面经##大数据开发# 附加信息:211本+985硕(非计算机),笔试4出头的分数,面了90分钟,面试官人超好,奈何本人过菜 1、部门介绍 2、自我介绍 3、项目介绍,在项目中承担什么角色,如何完成工作 大数据相关: 4、对大数据开发的理解 5、知道什么常用的大数据开发组件 6、谈谈MapReduce的原理 7、谈谈shuffle的实
个人情况简述:本硕双非,acm银牌 随便找群友要了个内推投递 笔试4.2题,投递选择的是都喜欢,笔试完在人才池待了十几天,被数仓部门捞了 一面(总时长50分钟) 聊实习经历和简历项目,聊了约30分钟 聊天环节把整个技术栈聊的差不多了,还有离线、实时数仓的很多点,后面又问了几个问题 离线数仓分层设计、实时数仓设计,spark、flink相关生成经验,S3、OSS的使用理解,k8s的使用心得等都在聊项
- 3/9笔试 - 选择题大概三四十个 - 问答题10个,涉及python,HSFS八股,Java八股 - 3/14一面,全是快问快答25min - 问简历,项目介绍,项目中提到的模型被揪出来问了细节 - 常见的机器学习算法讲讲,深度学习会多少呢? - 编程语言?希望会Java - 各种排序算法,时间复杂度,随便介绍几个呗 - Python的装饰器 - 指针和引用的区别(这是C++,但是当时并不知
大约45min 自我介绍 项目介绍 编程题: 顺时针打印矩阵(实际上变成了按顺序打印矩阵) 一个数的二进制有几个0 SQL: 每个学生合格了的成绩的平均分(HAVING) 总成绩第三名的学生 SHELL: 数一个文件出现了几个"beijing" 智力题: 3l和5l的杯子,量出4l水 操作系统: 死锁是什么、怎么解决 计网: 浏览器访问一个网站,有哪些过程 数据结构: 了解哪些数据结构 hashm
个人情况简述:本硕双非,acm银牌 测评答的个人感觉不错,笔试AK 测评隔天笔试(第一批),之后就跟大部队流程差不多约了一、二面 一面(总时长50分钟),二面(总时长40分钟) 纯业务理解,深挖实习经历和项目经历 提出的问题多为数仓设计问题和开放性问题,基本都是大量的对话和交流,因为很多想法是结合项目经验的临场idea,个人没有记录 携程给我的感觉就是,如果你做过很多项目,阅读过大量相关设计的学习
一、字节 data 数据库开发 1. 数据库相关知识 ○ CLOG, ○ XLOG ○ MVCC, ○ 增量提取,目的是什么,和原来的主从复制有什么区别 ○ 冻结事务, ○ 分布数据库事务提交, ○ pgsql的事务回滚, ○ 分区表, 分区表的元数据 ○ rocksDB、levelDB 2. move 函数,作用是什么 3. forward 4. 模板 5. 智能指针,shared_pointe
一般不写笔试的面经,单纯今天做题过程有点小心得就记录一下吧 3道算法题均ac,2道sql题和1道算法题,每题25分 1.求qq音乐平均完播率 2.求qq音乐每个用户top3播放音乐 3.字符串dfs问题 sql题不像算法题可以拿到部分分,反正我笔试一直以来sql题要么满分要么0分(笑死) 这次的2个题都属于很快把测试数据过了,然后一提交通过0 这里第一题的问题点在于我order by的时候,因为题
分享一下苏银凯基线上初面 线上会议 群面 早上9:35开始 10:20左右结束 两个面试官 首先轮流自我介绍 按照自己的编号一个个来 (一开始我还以为随机抽 紧张到我了) 每个人一分钟左右 轮到我的时候 不知道是不是因为带着耳机且面试官低头写东西 我还背的挺流利的 嗓音也挺亮 也没怎么紧张,不过语速还是有点太快了 应该有的放矢 重点的地方适当放慢 节奏找好才对。 介绍完后每个人说一下自己求职过程中
当时我来到了冉星的大楼,走进了刚刚安排好的面试房间。一面的面试官是一位年轻的数据分析师,他轻轻拍打着桌子,微笑着问我:“你好,请自我介绍一下。” 我心里有些紧张,但仍然振作精神,开始介绍自己的教育背景、工作经验以及个人技能。随着面试的深入,面试官逐渐引导我进入数据领域,并开始询问我关于数据处理和分析的问题。我使用SQL对一些数据进行了操作,并用Excel进行可视化展示,最终得出了可行的解决方案。面
离线数仓项目介绍 hdfs读流程 hdfs 中datanode怎么与namenode交互 mr过程 hive数据倾斜,介绍原因和解决方案 介绍一下网络结构,tcp在哪一层 java有哪些集合类 介绍java接口 MySQL索引 数据结构(B+树) 反问 上海银行数仓技术框架