数仓有哪几层,每层作用 星型模型和雪花模型 累计快照事实表,拉链表 如何进行维度建模 遇到的数据倾斜问题 大小表join 内部表和外部表区别 拉链表如何设计 spark为什么快 指标体系的建设和管理 用过bi报表之类的吗 炸裂函数,开窗函数 rdd和dataframe的区别
1.自我介绍 2.实习技术难点 3.项目技术难点 4.id timestamp 位置 三个字段完全一样的去重,sql怎么做scala怎么做 挑选同个人最后一个时间戳的记录,sql怎么做scala怎么做 5.spark submit提交参数 6.内存/并行度参数优化方案和技巧 7.当出现数据倾斜的时候怎么排查,怎么处理 不能只提八股,要完善分情况的答 8.两数之和 9.小数之和 10.反问,写sca
问题内容: 刚开始使用pandas和python。 我有一个工作表,已读入数据框并应用了前向填充(ffill)方法。 然后,我想创建一个包含两个工作表的Excel文档。 在应用填充方法之前,一个工作表将在数据框中包含数据,而在下一个工作表将应用了填充方法的数据框。 最终,我打算为数据框的特定列中的每个数据唯一实例创建一个工作表。 然后,我想对结果应用某些vba格式-但我不确定哪个dll或插件,或者
我正在Eclipse Neon中使用Hibernate工具(JBoss tools 4.4.0.Final)。现在,我想将数据库表反向工程为POJO对象和Hibernate映射文件。 我遵循了一些关于如何设置Eclipse来生成POJO对象的教程。在我运行配置之前,一切看起来都很好。什么都没发生,也没有抛出错误。有人能帮我吗?数据库是一个微软SQL服务器2014。 我的逆向工程配置文件看起来像:
笔试 Linux线上实操,比较简单,考察一些基础命令和网络相关的知识。 3个小实验 选择题+简答题。 好像是5选3 当时我选的 大数据 + Linux + 网络 两周出的结果,通过后HR会打电话,告知三门分数,然后让你针对性准备下笔试中不会的题目。一周后面试 面试 3面 一下午进行完 一面 40分钟 主要是考察个人对云计算的理解 英文面试 简单的几个英文对话 二面 40分钟 3个面试官 技术面 面
问题内容: 我有一个kafka stream应用程序,等待有关topic的记录被发布。它将接收json数据,并根据我想将该流推送到不同主题的键的值来确定。 这是我的流应用程序代码: 在此代码中,我要检查操作类型,然后根据需要将流推送到相关主题中。 我该如何实现? 编辑: 我已将代码更新为: 问题答案: 您可以使用方法来拆分流。此方法使用谓词将源流分成几个流。 以下代码取自kafka-streams
代码不应该在“参考”表中的“n”栏中的“电子邮件发送”栏中再次发送电子邮件。 如有任何帮助,我将不胜感激
2023实习第七场面试(2023.03.23) 30min 第五、六场都是蚂蚁,两个部门都是进系统前电话面的,没问什么内容就没记录,一个因为我不是java一个因为我不是硕士,都劝退我;最后我就没投蚂蚁,没进系统; 没有算法题,全程也没问什么东西,面试官中间沉默了得有七八分钟,绞尽脑汁的在想问我什么; 1.自我介绍 2.简历聊项目; 3.互斥锁的底层实现原理?信号量底层是怎么实现的? 4.生产者消费
更新,10.18意向 ------------------------------------------------- 9.25一面1h 自我介绍 Linux相关,Ros相关,主要问指令,问使用过程 C++八股 三大特性 对象模型 多态 虚函数的底层实现,虚函数表,子类的虚函数表,是否替换 new和malloc 智能指针,share_ptr的实现和使用过程 详细介绍STL 有没有碰到程序崩溃的情
自我介绍 自己做的权限管理脚手架 你是怎么来进行实现动态权限配置的 知道ABAC么 为啥使用JWT呢,JWT有什么优点呢 相对于其他几种状态保存机制,JWT有什么优缺点 你是怎么做登出的,流程说一下 项目redis优化的询问,你怎么来进行优化项目的 一面面试官没有写,怎么实现排序系统的,这个时候有拿出来问了一遍 然后有没有多机的场景 如果说当前需要实现当前12个小时的,那么应该怎么实现 反问 已凉
测评没有做,就直接面试。 10.13 一面 50分钟 1.面试官先介绍说同事有事,他来代替。 2.自我介绍。 3.事务隔离级别。 4.索引。 5.sql优化。 6.redis持久化。 7.缓存穿透、雪崩。 8.并发编程。复制。协作的工具: Semaphore 信号量 CountDownLatch 倒计时器 CyclicBarrier 循环栅栏 Exchanger 交换器 9.设计模式。单例模式实现
1、自我介绍 2、对新能源看法 3、询问实习经历 主要做了什么 4、因为要求要会两种语言,我选了python和go 后面主要问python的一些语法问题 5、sql的操作 增删改查 6、怎么提取邮箱,我正则表达式给他写出来了 7、Linux一些操作,怎么设置自动脚本(刚好以前操作过,不是很慌) 8、手撕算法,三道题,共享屏幕写出来(完美完成) 可能漏掉一些问题,随手记录 一套流程下来快一个半小时,
移动研究院 人工智能与智慧运营中心 后端开发工程师岗 -torch中深度学习优化器有哪些 -介绍一下springboot -列举一些springboot里比较常用的注解 -resource和aurowired的区别 -说一下类初始化的流程 -mysql innodb用的什么索引,为什么 -为什么索引不用二叉树而用b+树? -synchronized的过程 -线程池有什么了解?说一下主要参数 -对j
自我介绍 介绍一下项目 说一下epoll的工作原理 epoll连接的过程 压力测试的性能怎么样。 性能测试结果不理想,怎么优化服务器。 滑动窗口(流量控制):如果发送方发送的数据一直大于接受方可接受的窗口大小,应该怎么办? 服务器突然宕机了,你有什么检查问题的办法 快速重传怎么实现的。 说一下TCP拥塞控制 项目中遇到的最大的Bug是什么,你怎么解决的 投实习的第一个面试,问题很简单,但是答的啥也
双机位站立面试,不能透漏真实姓名,15-20分钟左右,有四个面试官轮流提问 先自我介绍(从个人特点、最想呈现给面试官的内容方面说) 1、怎么理解面向对象,对比面向过程有什么优势 2、jvm、jre、jdk区别 3、垃圾回收通过什么机制实现(没答上来,难道是垃圾回收机制?) 4、一些项目相关的问题 5、delete和truncate的区别 6、mysql默认隔离级别,可以解决什么问题 7、怎么判断索