timelime 9.5投递 9.13一面 9.17二面 9.19测评 10.7 21:00 收到意向邮件。 ---------------------------------------------- 防定位,面经先匿了。 #晒一晒我的offer##天翼云##大数据##秋招##国企#
总时长30分钟左右 1.自我介绍 2.大数据学习过什么技术? 3.数据工作有哪些岗位? 4.写一个二分法 5.一道sql,从表中提取出所有课程分数大于90的学生id 6.最近在学什么新技术? 7.进程和线程的区别?哪个开销比较小? 8.tcp和udp区别 9.职业规划 10.反问 总结:最近看测试内容比较多,对于大数据了解不多。面试官态度挺好,还要补的东西有点多我,sql都没写出来。找工作找得失去
面试时间:30min 自我介绍 HR常规询问,成绩排名、英语六级、籍贯、家庭、独生子女,高考分数。 研究生日常,工作学校都是怎么安排的?实习日常,加班情况? 实习项目介绍,背景,技术栈? Lamda架构介绍?为什么这么设计?流批一体概念? 技术选型考虑的问题? 选择OLAP数据库的依据?Clickhouse介绍? 研究方向介绍,论文情况,模型和创新点?工程落地? 对公司的意向度? 反问:部门业务?
一面 实习介绍 设计过哪些数据指标,这些指标的意义 项目介绍 具体分层怎么做的 表怎么设计的 对数仓和数据湖的理解 连续登录3天的用户 问的太少了,估计没想招我 #面经##大疆#
30min 自我介绍 项目: 介绍一下项目 几层。每层干了什么。去掉一层可以吗(又来) dwd和dws和ads都可以去掉 balabala 数据量 千万级别数据怎么同步? 业务datex+maxwell,行为 直接flume拉。 多久同步一次? 一天一次。 Ads层怎么接到可视化看板? 手拉(这边傻逼了,忘记说接clickhouse同步然后接到可视化软件上了) Zk在kafka里的作用? 保留of
自我介绍 手撕,股票最大利润 sql 成绩排名三 数仓分层 数据倾斜 遇到的问题 为什么要分层 分析了哪些指标 介绍一下spark 介绍一下hadoop 介绍一下hbase 反问 不知道哪的问题,又凉了面了这么多0offer
主要内容:1.现有数据存在的问题,2.系统架构1.现有数据存在的问题 1.1 开发数据服务门槛高 数据开发工程师除了开发完数据表外,通常还需要思考如下问题: 数据如何交付:业务通常期望使用数据接口方式来使用数据,而非数据表,这会更加灵活、解耦、高效。数据开发工程师因此需要建立对应的数据服务 服务如何开发:数据服务有多种形式,通常要求开发工程师有微服务知识、服务发现注册、高并发等 权限、可用性问题:开发完数据服务后,需要考虑权限问题,确保数据资
主要内容:1.开源OLAP综述,2.开源数仓解决方案1.开源OLAP综述 如今的开源数据引擎多种多样,不同种类的引擎满足了我们不同的需求。现在ROLAP计算存储一体的数据仓库主要有三种,即StarRocks(DorisDB),ClickHouse和Apache Doris。应用最广的数据查询系统主要有Druid,Kylin和HBase。MPP引擎主要有Trino,PrestoDB和Impala。这些引擎在行业内有着广泛的应用。 在云资源层,主要有E
主要内容:1.关系,2.区别1.关系 现在,没有什么流行词比大数据和人工智能更常见了。无数的分析家向我们保证,将从根本上重塑我们的日常生活。事实上,对于围绕人工智能和大数据的所有讨论,很少有人提到这两种新兴技术的融合,尤其是在解释人工智能为什么迫切需要大数据以取得成功的时候。 这是人工智能和大数据操作之间的秘密联系,以及这两种新兴趋势将如何主导21世纪。 没有大数据就不能拥有智能机器 在开始描述人工智能和大数据如何一起工作之
1.数据分层概念 2.Hadoop 和spark 优缺点 3.数据倾斜 场景题 大表和小表join 4.宽窄依赖 5.sql题 6.走楼梯算法 7.hive的用户自定义方法区别
五一前收到了暑期实习oc,记录一下时间线~ 4.8投递 4.23上午一面 4.27下午二面 4.28傍晚收到短信、邮箱、hr电话,收oc啦! 5.4今天上午收到邮件填了入职信息 base北京(望京东,要合租的女宝子请戳我!) 总结一下,我暑期实习4月份才开始投,算是比较晚,所以团子一面我的第一场面试,当时感觉回答的很不好,心里准备是直接进人才库的,收到二面通知时挺惊讶的,然后好好准备了项目,想要抓
介绍自己,介绍项目 实习公司数仓的分层,优缺点 实习期间遇到的困难,解决方案 维度建模的流程 怎么理解数仓是反应历史变化的集合的 实习时用的是什么任务调度工具 结合谷歌的三篇论文谈谈对Hadoop的理解 对YARN的理解 了解实时吗 反问,无手撕
硕士研究cv 可能和数据挖掘不是那么匹配~ 大华一面(1h): 1、增量学习的科研项目(问了具体的细节 以及为什么) 2、语义分割的发展 3、UNet中的跳跃连接的作用 4、残差网络的shortcut连接的作用,数学方面证明残差网络可以避免梯度消失,并且问了一个关于残差网络的改进问题(面试官看最新的论文看到的,我没有理解他所说的问题) 5、宫颈肿瘤分割和pcr预测的项目(细节也问的很详细) 6、预
问题内容: 我的redis实例似乎正在变得非常大,我想找出我那里的多个数据库中的哪个消耗了多少内存。Redis的命令仅向我显示了每个数据库的总大小和密钥数,这并没有给我带来太多的了解…因此,在监视Redis服务器时为我提供更多信息的任何工具/想法都将受到赞赏。 Redis文档没有显示任何可以返回某些键消耗的内存的命令,因此我想如果有错误代码会为Redis写很多“废纸t”,这可能很难找到… 问题答案
中午两点打过来,我说暂时没空约了晚上八点 面试时间控的很准,也没有反问就结束了 一面15min [项目]- [ ] Linux起一个服务端的过程 -[ ] 使用哪种epoll工作方式 - [ ] 水平触发与边缘触发编写时要注意些什么 - [ ] 多进程如何通信 - [ ] fork如何判断父子进程 - [ ] 虚函数的作用 - [ ] 虚函数的使用场景 - [ ] 了解的C++智能指针 - [ ]