当前位置: 首页 > 知识库问答 >
问题:

spark create或replace temp view会为Hive Metastore添加内存吗?

赵元白
2023-03-14

我正在分析spark应用程序的内存使用情况。我们使用蜂箱和Pypark

在我们的应用程序中,我们有许多类似以下的SparkSQL查询,当运行查询时,我们的hiveta存储服务器承受很大的压力并运行内存溢出。

虽然我找不到任何额外的cache()语句,但缓存的磁盘存储claim_temp将爆炸。只需选择数据,选择结果中有一些列,然后插入结果。(Claim_temp约为300 GB,将增长到1000 GB)

 SQL4 = """
                create temp view EX as
                select a.* from {0} a
                inner join {1} b
                on a.specialty = b.code
                where classification = 'ABCD'
                """.format(self.tables['Claims'],self.tables['taxonomy'])
  self.spark.sql(SQL4)

self.spark.sql("""insert into {0}.results_flagged
                select * from EX """.format()

创建临时视图语句是否将数据添加到Hive Metastore?

create temp view是一个配置单元SQL,它将在配置单元中被视为临时表,还是只是一个不添加任何内存的CREATEORREPLACETEMVIEW的替代品?

共有1个答案

张德佑
2023-03-14

它是一个与火花会话应用程序相关联的对象,在应用程序结束时被杀死

 类似资料:
  • 我正在使用PDFBox从我的webapp中提取数据并将其放入PDF。我有一个方法,在每个PDF页面上绘制标题。但是,当我向每个页面添加图像时,文档的内存就会耗尽。我想知道有没有人有什么解决的办法?下面是我的drawHeader方法: public static void drawHeader(PDDocument doc,PDPage page,PDPageContentStream conten

  • 问题内容: 我说了一个变量,里面有很多数据。我想通过以下方式使用此字符串的一小部分: 经过数小时的调试(使用内存可视化工具),我发现objects字段记住了的所有数据,尽管它仅包含子字符串。 当我将代码更改为: ..问题解决了!现在我的应用程序现在只占用很少的内存! 那怎么可能?谁能解释一下?我认为this.smallpart一直在引用数据,但是为什么呢? 更新:那 我怎么清除大字串?data =

  • 我正在尝试添加一个表单内的多种颜色的选项。问题是,即使在添加了一个在第一个颜色字段下面添加一个新字段的按钮之后,后续字段也不会保存在jQuery调用和PHP控制器上的dd()中。 供参考 以下是点击submit后我得到的信息。

  • 这是我的代码: 每次执行程序时,我都会创建一个新文档,我只想在不存在的情况下创建它,如果文档存在,只需添加内容即可。

  • std::list<TCHAR> ReturnList() 出栈后访问list是否可能出现THCAR被释放导致访问异常? 两个函数放的TCHAR* ,用完这个list后需要list.clear()吗?

  • 我有一个容器,它有一个头标签和一个div。div会消耗剩余的空间,因为容器的高度为100VH。在div中还有两个div,一切正常,但当我向右侧的div添加更多内容并缩小浏览器窗口时,它会溢出父div,我使用了flex box,所以它应该包装内容,而原始div的高度应该相应增加以包装它的元素,但它没有发生。 HTML: CSS: 我在这里做错了什么?是最小-最大高度/宽度吗?