使用指南 - 数据报告 - 概述 - 数据的下载与发送 百度统计除了在系统中为您提供形式多样的图表报告外,还支持您将数据下载到本地,供您更灵活地使用。另外,您还可以将下载的文档在特定的时间自动发送到指定的邮箱。 百度统计提供多种格式的下载文件,包括PDF、CSV等。 PDF格式图文并茂,支持较大数据量,阅读时需要PDF相应软件。 CSV格式不含图片,支持较大量数据,便于后期数据处理。 下载功能 在
一面 常见数据结构 维度建模 事实表建模 工作中维度建模是怎么处理 三种事实表的区别 mapreduce原理 hdfs读写流程 增大资源是否会有限制 是否遇到过数据倾斜 二面 数据倾斜 数据治理怎么做的 职业规划 爱好 三面 主题域 数仓建模 bucket join
一面 1.自我介绍? 2.为什么从数分做数开? 3.你觉得数分和数开有什么区别? 4.spark和hadoop哪段实习接触的? 5.讲一下mr和hive原理? 6.hdfs中,一个block大小和通常配置个数? 7.用spark还是用hive?spark比hive好在哪里? 8.spark既然是基于内存的,那么内存不够怎么办? 9.数据倾斜? 10.uid粒度和did粒度用在AB不同的场景是指什么
排队十分钟面试五分钟 自我介绍 数据倾斜 数仓分层 有没有在看其他金融银行 选择银行的原因 “看来你掌握的不错,今天的面试到此结束吧,注意查收笔试”
9.4 一面 1. 介绍实习经历 2. 数据同步 3. 指标分层 4. flink:状态,历史数据回溯、一致性保障、barrier下发、开始做ck的时间点、反压、下游怎么知道上游反压了、解决 5. hbase问题:架构、数据读写、底层文件存储、region划分、regionserver划分(这是啥) 6. jvm内存管理,多线程 7. spark问题:宽窄依赖,算子,shuffle,调优 8. 数
1h10 min 面试官是个大佬,全程面试偏场景题 八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件 场景题: 快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播 有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决 雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用
30min 问简历 快速排序 场景题:十亿个数怎么排序,十亿个double需要多少内存(算成GB,1亿个数怎么排序 研究生方向和项目 反问:今年招的人多不多。-不多,今年看到的简历是过去五年最好的(我人麻了 主要工作内容。-数仓搭建,开发相关,数据分析相关
一面:投的数研,实际数科 1.自我介绍 2.实习内容 3.实习团队架构 4.map reduce原理 5.数据倾斜有没有遇到过?怎么解决 6.ab实验原理、流程、如何分析 7.假设检验原理 8.口述sql题目:求连续登陆三天的用户 9.假设检验概率论场景题:求置信区间 10.常用的机器学习算法 11.随机森林原理 12.求职意向,数科还是数研,安排下一轮面试官(回数研后第二天结束流程) 13.反问
一面 数据同步怎么做的 事实表、维度表怎么设计 数据完整性、唯一性怎么保证 数据怎么分区,如果增量同步,需要历史数据合并分区慢怎么解决 数仓如何进行组件选型,理由 数仓建设过程中有哪些难点 atlas如何获取数据血缘 拉链表怎么设计 你觉得拉链表常用吗,为什么不用 那你为什么要设计拉链表 sql题 分组topn row_number rank dense_rank区别 看两个sql,差异在哪,哪个
8-3: 自我介绍 实习项目以及实习日常(20min左右) 论文(3分钟左右) 问你对大数据哪个组件比较熟悉 说一下MR的底层原理。。。。。。自己在那不知道从哪里开始说,就从map开始巴拉巴拉到写出数据,自己都讲蒙了。(五六分钟左右) 反转链表,自己处理输入输出以及链表定义(七八分钟),也没给输入输出,就只写了方法体。 先问对hive函数了解咋样,都还行。写SQL:uid,login_time,连
第一次写面经 快手音视频部门 感觉技术挺好就接了 一面 6.13 主要问了Flink的相关问题以及实习的流批一体项目 具体问的Flink问题就是数据倾斜、反压以及状态后端、checkpoint相关 面试的时候面试官提了个flink相关的名词 问我了解过吗 表示从没听说过 面试官说问题不大 具体细节问题忘记了 然后就是jvm、多线程相关的知识 这部分答的不好 没咋看java 最后就是两道算法 二面
技术一面 1,自我介绍 2,做过最难的一个功能模块,遇到最难的问题 3,现场做一道设计题,比较T1,T2两个表的数据,找出ID相同的数据(1)数据大小256M;(2)数据大小为4G; 4,面向对象的特征,如何实现多态。
本文向大家介绍Android开发实现查询远程服务器的工具类QueryUtils完整实例,包括了Android开发实现查询远程服务器的工具类QueryUtils完整实例的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Android开发实现查询远程服务器的工具类QueryUtils。分享给大家供大家参考,具体如下: 更多关于Android相关内容感兴趣的读者可查看本站专题:《Android开发
如何像浏览器一样,如果使用移动端调试,当鼠标移动到手机模拟的边框时,可以通过拖动随意调整模拟器的宽度?
如果我在主机上运行这个命令(ubuntu) 它发送udp数据包,端口8125上运行的dogstatsd代理将其接收,我可以看到它。但是,当我在同一台主机上的docker容器上运行以下命令时,这里是执行docker ps时容器的端口映射 这不会击中主机,也不会被8125上主机上运行的dogstatsagent捕获。这是Dockerfile中的代码公开行 我做错什么了吗?