主要内容:1.建模锯齿,2.数据粒度的锯齿操作,3.下游表依赖上游表问题,4.数仓数据域划分方式,5.数仓一致性是如何保证的,6.数仓优化,7.数据全生命周期,8.数仓建模问题,9.数仓建模过程1.建模锯齿 建模锯齿是指在建模过程中的一种常见的效应,其中模型的输出可能会产生锯齿状的波动。这种效应通常是由于模型的不稳定性或过度拟合导致的。 在建模过程中,锯齿可能会使模型的表现变差,并且在预测新数据时也可能出现不一致的结果。因此,在建模时需要注意避免出现锯齿状的波动。 一种常用的方法是使用正则化来限
主要内容:1.数仓高内聚低耦合,2.多重粒度,3.如何提高查询效率,4.数仓数据域划分几种方式,5.粒度操作,6.SQL实现,7.数仓中ODS层命中多少为合理,8.数仓价值链的体现和实现,9.建立数仓的步骤,10.指标生命周期的评估,11.数据治理,12.数仓的目的1.数仓高内聚低耦合 一般复杂的公共逻辑可以采用抽象类和抽象方法的方式下沉到共有模块中,然后由相关子类去实现抽象方法,来实现不同的功能。这样可以将复杂的逻辑拆分成各个子类,使得类之间的耦合度降低,提高代码的可维护性。 2.多重粒度 在
主要内容:1.数仓构建,2.数仓最重要的是什么,3.如何保证数据的准确性,4.如何做数据治理?数据资产管理呢,5.如何控制数据质量,6.元数据的理解?元数据管理系统,7.数仓如何分层的?及每一层的作用,8.为什么要分层1.数仓构建 1). 前期业务调研 需求调研 数据调研 技术选型 2). 提炼业务模型,总线矩阵,划分主题域; 3). 定制规范 命名规范、开发规范、流程规范 4). 数仓架构分层:一般分为操作数据层(ODS)、公共维度模型层(CDM)和应用数据层(ADS),其中公共维度模型层包括
主要内容:1、什么是数据仓库?,2、数据仓库和数据库的区别?,3、如何构建数据仓库?,4、什么是数据中台?,5、数据中台、数据仓库、大数据平台、数据湖的关键区别是什么?,6、大数据有哪些相关的系统?,7、如何建设数据中台?,8、数据仓库最重要的是什么?,9、概念模型、逻辑模型、物理模型分别介绍一下?,10、SCD常用的处理方式有哪些?,11、怎么理解元数据?,12、数仓如何确定主题域?,13、如何控制数据质量?,,,,1、什么是数据仓库? 权威定义:数据仓库是一个面向主题的、集成的、相对稳定的、
记录下最近虾皮 Shopee UI/UX 设计的面试经验,这个岗位是 hr 主动来找到我电话沟通咨询是否有意向投递的,投递后很快通过了简历筛选,技术面总共有三轮,第一轮结束后会需要完成一份笔试题目,然后进入第二轮,但由于在第二轮的时候聊得不太同频道,所以面经里只包含了第一二轮遇到的面试问题啦,全程中文。 部分高频出现的问题: 1、自我介绍 2、用户研究能力(后续了解到因为他们团队没有细分的 res
已经hr面后一周多了,记录一下讯飞的面经,实话说,讯飞真的是俺面试公司里体验最好的,可惜流程也是真的久,希望能拿到offer吧 一面45分钟左右: 为啥想做测试 了解过测试工程师需要的工作技能吗 说一下实习中遇到的问题 实习工作的算法准确率是如何获得的 了解过工程化吗,比如将模型构造为服务提供外界访问 对模型实现并发访问有了解吗 实习中通过什么方式实现的抽帧 视频的分辨率、码率了解什么意思 个人倾
一面: 测试开发中的杀虫剂效应 测试开发哪个阶段bug比较多 研发提交代码质量反馈阶段 自己经历跨度比较大:喜欢有挑战性的事情,不同的位置去尝试 为什么选择测试 为什么选择大疆 大疆新品有了解吗 反问:收获与成长 二面: 自我介绍 介绍实习:优秀实习生小组、功耗下降趋势是怎么样的 介绍项目:如何判断2000个客户端是服务器达到极限了而不是机器(阿里云网站数据) 为什么想做测试(1.重要,2.上岸机
项目问题: 1、增强纠错译码项目是怎么做的?目前有几个人在做? 2、该项目未来方向是利用bert来提取自然冗余信息,具体怎么做? 3、NLP的发展历史?(attention+transformer+bert) 4、bert的两个应用场景?(完形填空+给一句话预测下一句) 5、你生活中是怎么使用大模型的?(chat-gpt?文献检索+代码解读+图像生成) 6、yolo和R-CNN区别? 7、目标检测
bg两端大厂AIGC实习,两篇学生二作a,面试体验很好,流程推进很快,可以从容准备其它的面试了 一面 1、清洗策略 2、特征压缩模块如何做 3、自动化数据采样策略是怎么自动化的? 4、模型评测的指标 5、通用模态数据集是怎么构建的 6、CLIP中都有哪些数据采样策略 7、手撕 迭代法中序遍历 二面 1、实习项目介绍,遇到的任务是什么,挑战和难点 2、Multi-agent提升术多样性,降低拟人化B
了解大数据吗? 分布式是什么? 1、list、set、map之间的区别与联系 2、arraylist和linkedlist之间的区别与联系 3、数组与链表的区别 4、线程和进程的区别?为什么要设置线程? 5、线程安全如何保证?几种方法?为什么会出现线程不安全 6、线程池用于干啥? 7、同步与异步的概念? SQL相关 1、讲一下索引?索引怎么实现 2、列排序是什么数据结构? 3、B树和B+树的区别?
岗位:项目管理-运营实习生 状态:大概凉了 过程: 自我介绍 为什么不找你专业相关的工作? 为什么学习与你专业不相关的数据分析和python? 出了一道题:如果让你一个月内上线10000道试题,你会怎么做?(考察沟通能力和逻辑思维能力) 自己回答情况:别的都还好,问的那道题自己回答的逻辑思维混乱,沟通表达不是很清晰 95%的概率凉了,但是那个岗位我真的好想去,那个岗位主要包含三方面:数据分析,跨部
#2023届#TCL华星光电#提前批#技术研发岗#笔试&专业面试 笔试部分: 时间:2022.07.31 内容:全部选择题(多选和单选),考察内容涉及材料类、光学、半导体、显示器件常识等。 评价:虽说机械工程是万金油,没准备的情况下也只能自求多福了。 专面部分: 时间:2022.08.01 面试官:1位业务主管(A)+1位HR(B) 面试平台: 使用腾讯会议进入面试室,进入后在等候间耐心等待,一般
#TCL华星光电# #提前批# #技术研发岗# #测评# #笔试# #面试# 测评: 性格测试约一百多道,不限时;言语,图形推理,资料分析各15道,每道限时1分半;心理测试约几十道,不限时。 笔试: 1小时42题,主要考材料类(半导体物理,聚合物,基准物等),光学类(光折射,红蓝绿波长,三原色,液晶屏等),物理类(德布罗意波公式等);总体而言,内容比较杂。 面试: ①自我介绍;②
面试时间:12-05 面试岗位:解决方案测试 面试问题: 一面: 数据库相关知识(索引机制、事务机制等) 操作系统相关知识(常用命令) python语法(类、对象,装饰器等) 项目相关的内容 一道编程题(简单难度) 二面: 数据库相关知识(深入提问) 操作系统(难度提高,问到了内核、文件系统相关的知识) 项目介绍(自述,根据自述以及简历的介绍提问) 一道编程题(简单题,最后也要求自己写几个case
经过数月的挣扎和努力终究顺利上岸,前来还愿,顺便给之后的愿意来OD的小伙伴们一点小小的帮助。前前后后也算小3个月,实属不易,也多亏了这边的HR和对接人的耐心指导和鼓励,让自己顺利度过了难关。最终有了结果,也多少给自己的努力带来了点回报吧。 个人大概情况: 末流985高校本科毕业,在本地公司工作了几年,感觉不到未来的发展方向,工作、生活、感情均不是特别顺利,觉得有必要换个工作试试,正巧,华为西安项目