问题：

spark sql窗口函数滞后

田修为

2023-03-14

我在Scala中查看窗口幻灯片函数中的SparkDataFrame。

Col1    Col2    Col3    date     volume new_col
                        201601  100.5   
                        201602  120.6   100.5
                        201603  450.2   120.6
                        201604  200.7   450.2
                        201605  121.4   200.7`

val windSldBrdrxNrx_df = df.withColumn("Prev_brand_rx", lag("Prev_brand_rx",1))

共有1个答案

昝成弘

2023-03-14

您做得正确，所遗漏的是over（窗口表达式）onlag

val df = sc.parallelize(Seq((201601, 100.5),
  (201602, 120.6),
  (201603, 450.2),
  (201604, 200.7),
  (201605, 121.4))).toDF("date", "volume")

val w = org.apache.spark.sql.expressions.Window.orderBy("date")  

import org.apache.spark.sql.functions.lag

val leadDf = df.withColumn("new_col", lag("volume", 1, 0).over(w))

leadDf.show()

+------+------+-------+
|  date|volume|new_col|
+------+------+-------+
|201601| 100.5|    0.0|
|201602| 120.6|  100.5|
|201603| 450.2|  120.6|
|201604| 200.7|  450.2|
|201605| 121.4|  200.7|
+------+------+-------+

这段代码是在Spark shell 2.0.2上运行的

类似资料：

SparkSQL-滞后功能？

问题内容：我在此DataBricks帖子中看到，SparkSql支持窗口函数，特别是我正在尝试使用lag（）窗口函数。我有几行信用卡交易，并且已经对它们进行了排序，现在我要遍历各行，并为每一行显示交易金额，以及当前行金额与上一行金额的差额。在DataBricks帖子之后，我提出了这个查询，但是它给我抛出了一个异常，我无法理解为什么。这是在PySpark中。tx是我在注册为临时表时创建的数据
具有动态滞后的窗函数

我正在查看Spark SQL中的Spark DataFrame的窗口幻灯片函数。我有一个包含列、和的数据表。
QueryDSL窗口函数
带有滞后窗口函数的火花任务不可串行化

我注意到，当我在DataFrame上使用窗口函数后，如果我用函数调用map（）时，Spark会返回一个“Task not serializable”异常这是我的代码：这是堆栈跟踪：异常：任务不可序列化在org.apache.spark.util.ClosureCleaner$.EnsureClealizable（ClosureCleaner.scala:304)在org.apache.spar
Python Pandas窗口函数

主要内容：rolling(),expanding(),ewm()为了能更好地处理数值型数据，Pandas 提供了几种窗口函数，比如移动函数（rolling）、扩展函数（expanding）和指数加权函数（ewm）。窗口函数应用场景非常多。举一个简单的例子：现在有 10 天的销售额，而您想每 3 天求一次销售总和，也就说第五天的销售额等于（第三天 + 第四天 + 第五天）的销售额之和，此时窗口函数就派上用场了。窗口是一种形象化的叫法，这些函数在执行操作时，就
Oracle开发之窗口函数

本文向大家介绍Oracle开发之窗口函数，包括了Oracle开发之窗口函数的使用技巧和注意事项，需要的朋友参考一下一、窗口函数简介：到目前为止，我们所学习的分析函数在计算/统计一段时间内的数据时特别有用，但是假如计算/统计需要随着遍历记录集的每一条记录而进行呢？举些例子来说： ①列出每月的订单总额以及全年的订单总额 ②列出每月的订单总额以及截至到当前月的订单总额 ③列出上个月、当月、下一月的订

spark sql窗口函数滞后

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档