自我介绍(尽量与职位相关) 数据仓库的分层结构 如何为新业务建模 选择模型的依据和考量 设计一个一对多关系的事实表和维度表 实习中使用的计算引擎 Spark UI的关键内容 数据倾斜问题的解决方法 项目介绍 指标下沉时为何要拆分 SQL调优的具体案例 SQL题:求中位数
题目描述 sql='select * from A',A表有8百万数据 前段时间写了数据库互相导数据的Python脚本,是Oracle导入postgreSQL,使用cx_Oracle执行execute(sql)没有任何问题。这次是postgreSQL导入postgreSQL,使用psycopg2执行execute(sql)就直接卡死在这一行了,并且内存占用持续上升。 自己的思路 数据库连接是没有问
大概1h 1.问基本情况 2.docker和java和k8s和大数据的接触情况 3.docker和虚拟机区别,以及虚拟化层次区别 4.java异常分类 5.看代码想结果 6.数据库mysql编码方式区别 7.mysql主键索引一般咋用,有没有用string作为主键 8.delete和tuncate区别 9.uuid和主键id区别 10.7层分层模型和什么层什么协议 11.长连接和长连接长连接在哪一
1.项目介绍+闲聊18min 2.springboot事务失效场景 3.uuid和自增id区别,分库分表场景下 4.使用过的JUC 5.分布式锁、ID实现原理,项目里的技术选型 6.快照读和当前读,以及mysql下对应的问题 7.手写除单例模式外其他的设计模式 8.求给定的数组中和为0的最长子序列的长度 update8点通知过了,约第二天二面
发帖求好运 部门:基础研发平台-数据科学与平台部 --------- 一面:57min 1.自我介绍; 2.讲最熟悉的项目; 3.爬虫遇到的问题,如何处理的呢; 4.mysql:left join \ right join \ full join,用一个案例讲一下; 5.数据仓库了解吗; 6.Hashmap的原理了解吗; 7.Hadoop了解吗; 8.NameNode了解吗; 9.HDFS为什么安
1.问项目 2.接触过数据库有哪些 3.用过mysql的哪些功能 4.有没有优化过mysql的性能? 5.linux常用命令 6.hive表类型 7. 内部表和外部表区别 7.左连接右连接全连接内连接 8.hdfs shell 问的都打上来了 面试官说下周发offer= = 整个过程13分钟,好快,想到第一个面试1.5hT T
1、flume架构组成以及作用 2、flume到kafka中,如何保证同一个组件的数据放在kafka同一个分区里面 3、kafka支持全局有序吗?kafka isr?介绍kafka副本与hdfs副本区别 4、zookeeper在项目中的作用?如何判断节点是否存活? 5、HDFS什么功能用到了zookeeper? 6、spark的执行流程,比如做一个wordcount 7、sparkcontext内
16 min 七点左右打的电话,问我什么时间有空面试,我当时正和女朋友在汤泉泡澡,心想周六晚上怎么搞这么一出,就有些火大,也没改时间,反正也不去,应付一下吧。 Java、Python用的那个熟练? Java水平怎么样,常用的框架都会那些? Java 字符串的API有那些? 集合用过那些?有那些API? 怎么遍历集合?迭代器讲讲? 说说快排的思想? 比较器怎么实现? Linux shell 命令 讲
我有个错误 2021-02-04 10:31:48.341警告6496--[nio-8080-exec-8].w.s.m.s.defaultHandlerExceptionResolver:已解析[org.springframework.http.converter.httpmessagenotreadableException:JSON分析错误:无法构造的实例(尽管至少存在一个创建者):没有字符
这是Azure函数4x的问题(进程外) 我试图使用HTTP触发器将超过4MB(4096字节)的数据发布到Azure函数。 它超时了。下面是我在Azure函数中的代码 我使用Postman作为客户端,配置如下: 邮差配置 4 MB的测试文件 我查了微软的文档https://docs.microsoft.com/en-us/azure/azure-functions/functions-binding
本文向大家介绍Python实现利用最大公约数求三个正整数的最小公倍数示例,包括了Python实现利用最大公约数求三个正整数的最小公倍数示例的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Python实现利用最大公约数求三个正整数的最小公倍数。分享给大家供大家参考,具体如下: 在求解两个数的小公倍数的方法时,假设两个正整数分别为a、b的最小公倍数为d,最大公约数为c。存在这样的关系d=a*b
Python3 实例 以下实例为通过用户输入两个数字,并计算两个数字之和: 实例(Python 3.0+)# -*- coding: UTF-8 -*- # Filename : test.py # author by : www.runoob.com # 用户输入数字 num1 = input('输入第一个数字:') num2 = input('输入第二个数字:') # 求和 sum = flo
问题内容: 上下文:我正在构建一个读取rss feed并在后台更新/检查feed的小站点。我有一个数组来存储要显示的数据,另一个数组来存储已显示的记录的ID。 问题:在事情变慢或变慢之前,数组可以在Javascript中容纳多少个项目。我没有对数组进行排序,但是正在使用jQuery的inArray函数进行比较。 该网站将保持运行状态,并进行更新,并且不太可能经常重启/刷新浏览器。 如果我想从数组中
问题内容: Java数组可以包含的元素数量是否有限制?如果是这样,那是什么? 问题答案: 即使测试很容易,也没有找到正确的答案。 在最新的HotSpot VM中,正确的答案是。一旦超出此范围: 你得到:
thoses线有什么问题 “data”属性应该是$ref中给出的模式类型的数组,但这是结果 好的,似乎正确的方法是tu把$ref直接放在items键下,我的问题是使用保留键“status”,那么,我如何在对象模式中使用保留键呢? 在我的客户机模式中,我将属性status放了两次,但我没有看到它已经存在,所以当我更改属性名时,它起作用了,我在想“status”可能是一个保留的关键字。