mapreduce中有哪些排序 yarn的事件驱动 hbase写热点问题 建表时怎么指定空region spark sql中dataframe怎么把表中的字段提取出来 hive怎么提取出来 yarn中的container怎么实现 写一个sql,学生不同学科的得分排名前三 手写单例模式,策略模式,工厂模式,并描述在什么场景下使用,口述一下装饰者模式 arraylist和linkedlist的区别,什
hdfs读写流程 spark内存管理 项目中遇到的问题,怎么解决的 项目中都有哪些表 怎么处理缓慢变化维 拉链表怎么做,开链闭链怎么 数仓和数据湖 维度建模,星型模型,雪花模型 数据倾斜,小表join小表,大表join大表 遇到过的数据倾斜,怎么做的 手撕,二叉树中序遍历,非递归写法
数据倾斜问题 写个sql吧 再写一个sql吧, 写挺好啊,在写一个吧 这些你是练习过原题吗,在写一个sql吧 说一下数仓的分层,每层干了什么事? 说一下归并排序的过程 xgboost原理 线性回归,逻辑回归 聚类了解吗 说一下spark怎么实现map join
自我介绍 专业课程、成绩 是否学过计算机专业课(408) 线程、进程的区别 编译型语言和解释性语言区别、使用场景 计算机32位、64位存储空间多大 Java内存存储 Linux通过文件名、文件内容查找 介绍Redash 比较ClickHouse、Doris和Mysql架构、使用场景和优缺点 b+树的优势 实习主要工作 反问: 如何使用好一个数据模型 对我的建议
自我介绍 深挖实习经历 (介绍实习主要工作、场景复盘等等延伸) hive相关 (hive原理、hive sql区别) 数据倾斜的常见case ClickHouse相关 group by原理 left join与right join区别与特点 主要技术栈 对岗位的理解 反问: 部门与产品业务线 校招生定位
1.自我介绍 2.熟悉flink还是spark 答:flink 3.介绍下flink架构吧 答:这里越深越好,我就讲到了flink的jobmanager(dispathcer,jobmaster)和taskmanager 4.flink有哪些算子? 答:map,flatmap,filter,window,union等,RichFunction提供生命周期open close,上下文环境。 5.fl
#歌尔# 项目 ETL部分 拉链表的设计与作用 数据量的大小 为什么选择kmeans,介绍一下其他的聚类方法 八股 介绍下数据仓库的分层 大数据中的数据倾斜 hive开窗函数 spark streaming和flink的区别 sort by 和 order by的区别 有没有用过doris等 (没用过) 什么时候可以来实习
自我介绍 实习工作介绍 事实表与维度表如何搭建 星型模型与雪花模型 维度冗余 业务场景理解 数据倾斜原因和常见手段 手撕 一道sql: 连续登录7天用户 两道算法: 二维动态规划 n! 尾数0的个数
项目 垃圾回收,JVM调优 Elasticsearch 结构 索引 集群分片 redis 数据结构 mysql优化,事务 ,索引,MVCC 聊天
4.27 1h B2B,百度电商部门 介绍完自己直接开始写算法题 随机数据的峰值,如 1 2 3 6 5 8 7,返回 6 或 8都行,要求时间复杂度O(lgN) 斐波那契数列,要求时间复杂度O(lgN),矩阵解法 求两个字符串的最长公共子串,如 abcedfgh 和 bcedgh 最长公共子串是bced 求两个字符串的最长公共子序列,如 abcedfgh 和 bcedgh 最长公共子序列是bce
我有一个在塔伦德创建序列的要求。基本上,记录来自源文件。对于每个源行,我希望创建一个唯一的数字。这就是事情变得复杂的地方。当第二天出现新文件时,talend应该选择最后生成的数字,然后用1递增它。对于EX:今天,最后生成的序列号是100。明天talend应该从100生成序列号。即101,102,103,104....这意味着talend应该保留以前生成的最后一个序列号的历史记录。 谢谢
本文向大家介绍我用的一些Node.js开发工具、开发包、框架等总结,包括了我用的一些Node.js开发工具、开发包、框架等总结的使用技巧和注意事项,需要的朋友参考一下 开发工具 1.WebStorm,毫无疑问非他莫属,跨平台,强大的代码提示,支持Nodejs调试,此外还支持vi编辑模式,这点我很喜欢。 2.做些小型项目用Sublime Text。 3.Browserify:将你的nodejs模块应
问题内容: 我有一个C / Windows程序,该程序通过WM_COPYDATA消息从另一个C 程序接收数据。然后应该使用Sockets / winsock将此消息发送到用Java编写的服务器上。客户端可以很好地连接到服务器,但是它似乎无法及时发送消息。但是,一旦客户端关闭,它应该已经发送的所有消息都会一次性发送出去。这是Java服务器的终端输出示例: 发生这些事件时,Java服务器将输出前两行。
问题内容: 我试图了解线程如何在Java中工作。这是一个简单的数据库请求,返回一个ResultSet。我正在使用JavaFx。 这将返回一个异常: 线程“线程A”中的异常java.lang.IllegalStateException:在FX应用程序线程上不;currentThread =线程A 如何正确实现线程,以便每个数据库请求都在第二个线程而不是主线程中执行? 我听说过实现Runnable,但
首先自我介绍; 介绍完毕后狂问项目,列举出来的所有都会问的很细,自己对于项目一定要把控好,写上去的一定一定要全会; 还问了一些专业问题: 在软件上,有中断号,中断向量表,中断函数,3者的关系是什么? 发生中断,芯片会做什么? 如何唤醒已经睡眠的模块? RISC和CISC的区别? UART的数据格式?如何保证在侦听UART时不会一直判断接收到0? 为什么一般C程序中不使用goto? 最后还有时间,给