23.9.21 广立微 共计半小时 在阿里做的项目介绍一下 充电场站项目。。。 用户画像项目详细介绍 java大数据去重的方法 python数据清洗用的什么方法 你们阿里的数据中台中表是以什么格式存储的 模型的评级标准是什么样的 python直接取一行数据 hive窗口函数,一个省一个市,取人口最多的两个城市 hive的行转列和列转行用什么函数 lead和lag是干什么的 mysql不同的关键字的
数据库底层索引的优劣势? 数据库底层索引的优势和劣势主要取决于具体的索引类型和使用场景: 优势: 提升查询性能:索引可以加快数据库的查询速度,通过跳过不需要的数据块,减少了磁盘I/O操作。 加速排序:索引可以帮助数据库对查询结果进行排序,从而提高排序的效率。 支持唯一性约束:索引可以保证某一列或多列的唯一性,保证数据的完整性。 提高并发性能:索引可以减少数据的锁竞争,提高数据库的并发性能。 支持数
面试内容 一面(乙方): 1、聊一下熟悉的数据库,关系型,非关系型都说一下? 2、介绍一下clickhouse,为什么用它? 3、说一下简历上项目,数仓的分层架构,每一层的作用? 4、入库做数据清洗吗?还是后续在数仓中过滤?说一下实际的做法 5、数据同步是怎么做的?你在项目中的角色?(说了kafka) 6、你这个是离线的数仓吗?你觉得什么需要做数仓? 7、为什么用flinkcdc? 8、spark
前面的IEG秒挂后2天被这个部门捞了,这几天准备了下算法,但是项目有点懈怠了 时间:3月11日 14:40 ,时长45分钟 全程拷打Java项目,掺了一些业务相关的八股 拷打查询优化细节: 因为项目亮点手贱,写了用Redis缓存优化前时间、优化后时间。结果疯狂拷打怎么得出的优化时间 其实是编的数据😭😭,引以为鉴!! ⭕查询时间是怎么测出来的? 肉眼对比效果 + 查询前时间 对比 查询后时间 ❌
1、自我介绍 2、跳槽理由 3、介绍团队 4、自己感觉做的最好的项目(扣的很细,聊了很久) 5、遇到过的技术问题 6、数据倾斜如何解决 7、缓慢变化维怎么解决 8、周期变化事实数据,比如七天累计订单表应该放哪一层?为什么? 9、什么数仓才算一个好的数仓 10、雪花模型跟星型模型区别 11、写sql题 12、反问 面了三家 淘天、字节、pdd,都offer了,这个草稿也是当时写的一直忘发了,后面有空
115、Spark的任务执行流程 driver和executor,结构式一主多从模式,driver:spark的驱动节点,用于执行spark任务中的main方法,负责实际代码的执行工作;主要负责:将代码逻辑转换为任务、在executor之间调度任务、跟踪executor的执行情况。 Executor:spark的执行节点,是jvm的一个进程,负责在spark作业中运行具体的任务,任务之间相互独立,
模型开发的流程,需求调研过程中有哪些人员参加,调研过程,你会输出什么文档? 如何保障数据质量(准确性)? spark有什么优缺点?在使用过程如何规避缺点? spark内存模型? spark和MR为什么会进行shuffle,如何减少shuffle? 小文件治理的方式? 主题域建设的流程? 大表join大表的优化(10亿与1千万数据关联)? 为什么存在ods穿透? 为什么离职,旧公司工作强度如何? 这
本文向大家介绍JS获取月份最后天数、最大天数与某日周数的方法,包括了JS获取月份最后天数、最大天数与某日周数的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了JS获取月份最后天数、最大天数与某日周数的方法。分享给大家供大家参考,具体如下: js得到一个月最大天数 JS里 面的new Date("xxxx/xx/xx")这个日期的构造方法有一个妙处, 当你传入的是"xxxx/xx/0
本文向大家介绍在C ++中执行给定操作后,数组中最大数目的相等数,包括了在C ++中执行给定操作后,数组中最大数目的相等数的使用技巧和注意事项,需要的朋友参考一下 给我们一个整数数组。目标是在执行给定操作后找到数组中等于的最大数- 选择两个元素a [i]和a [j],使i!= j和 递增a [i]并递减a [j](a [i] ++,a [j]-) 我们将取数组的总和除以元素数。如果N是数组的大小,
本文向大家介绍查找一个数字,该数字将C ++中的最大数组元素相除,包括了查找一个数字,该数字将C ++中的最大数组元素相除的使用技巧和注意事项,需要的朋友参考一下 在本教程中,我们将找到在给定数组中划分为最大元素的数字。 让我们看看解决问题的步骤。 初始化数组和变量以存储结果。 遍历数组。 如果当前元素可被数组元素整除,则增加计数器。 初始化计数器变量。 再次遍历数组。 如果当前计数最大,则更新结
好吧,基本上我做了一个自动售货机程序。当用户购买等于或大于其成本的商品时,该商品的库存将耗尽1。该商品最多被购买三次,直到库存用完。此时,JButton将消失,商品无法点击或购买。为了增加复杂性,我添加了一个“检查总库存”按钮。点击时应该发生的是,程序打印出最小到最大的库存量。 例如: 要做到这一点,这里是我使用的循环:私有的空CheckInventoryActionPerform(java.aw
如果你取一个数字,取它的平方根,去掉小数点,然后把它提高到二次方,结果应该总是小于或等于原来的数字。 这在python中似乎是正确的,直到你出于某种原因在上尝试它。 它看起来像是数学。pow(数学楼层(数学sqrt(99999999999999975425)),2)返回。 我假设这与我们在python中存储值的方式有关...一些与浮点算术相关的东西,但我不能具体解释这是如何影响这种情况的。
我还没有足够的信誉点来留下评论,但我看到过很多次,当人们(错误地)建议使用log10来计算正整数中的位数时。这对大数字来说是错误的! 我想知道为什么。 获取整数中位数的方法? 获取数字上位数的最快方法?
我做了一小段代码,目的是尝试将一个数字的所有数字存储到一个数组中。例如,数字“123”将存储为{1,2,3}。一切似乎都很好,除了数字的长度大于10。我的方法有什么问题吗?确切的错误消息是 异常线程"main"java.lang.NumberFormatException:对于输入字符串:"1202020202020202020"在java.base/java.lang.NumberFormatE
本文向大家介绍scikit-learn包如何用于将特定大小的数组转换为其他大小?,包括了scikit-learn包如何用于将特定大小的数组转换为其他大小?的使用技巧和注意事项,需要的朋友参考一下 Scikit-learn,通常称为sklearn,是Python中的一个库,用于实现机器学习算法。这是一个开源库,因此可以免费使用。它功能强大且强大,因为它提供了多种工具来执行统计建模。在Python强大