当前位置: 首页 > 知识库问答 >
问题:

多元时间序列预测

葛飞扬
2023-03-14

我正在阅读Keras中关于使用LSTM进行多元时间序列预测的教程https://machinelearningmastery.com/multivariate-time-series-forecasting-lstms-keras/#comment-442845

我已经看完了整个教程,遇到了一个如下的问题-

在本教程中,在步骤“t-1”中,列车和测试拆分有8个功能,即“污染”、“露水”、“温度”、“压力”、“wnd_dir”、“wnd_spd”、“雪”、“雨”,而在当前步骤“t”中,输出功能为“污染”。这是因为,数据集作为监督学习问题的框架是关于预测当前小时/时间步“t”的“污染”,考虑到前一小时/时间步“t-1”的污染和天气测量

在将模型拟合到训练和测试数据分割之后,如果我想预测一个具有7个特征的新数据集,因为它没有“污染”特征,我明确地只是想用其他7个特征来预测这个特征,那该怎么办特点。

谢谢你的帮助!

我如何处理这种情况?(其余7项功能保持不变)

编辑-假设我的数据集在培训/装配模型时具有以下3个功能-商店编号、商品编号、售出的单位数量

在我训练了LSTM模型之后,我得到了一个具有“shop_number”和“item_number”特征的数据集。数据集没有“已售出的单元数”。

LSTM中的input_shape参数有1作为时间步长,3作为训练时的特征。但是在预测时,我有1个时间步长,但只有2个特征(因为number_of_units_sold是我必须预测的)。

那么我应该如何继续?

共有1个答案

卫烨
2023-03-14

如果污染是最后一个特征:

X = original_data[:,:,:-1]
Y = original_data[:,:,-1:]

如果污染是第一特征

X = original_data[:,:,1:]
Y = original_data[:,:,:1]

其他的

i = index_of_pollution_feature
X = np.concatenate([original_data[:,:,:i], original_data[:,:,i+1:],axis=-1)
Y = original_data[:,:,i:i+1]

制作一个带有return\u sequences=Truestative=False的模型,就是这样。不要使用扁平化、全局池或任何删除步骤维度的方法

如果你根本没有任何用于训练的污染数据,那么你就不能。

 类似资料:
  • 根据教程,我为我的数据集开发了多元输入多步骤LSTM时间序列预测模型(https://machinelearningmastery.com/how-to-develop-lstm-models-for-multi-step-time-series-forecasting-of-household-power-consumption/). 然而,我有一个非常奇怪的问题,那就是,当我使用较小的样本(5

  • 我有一个包含一整年数据的时间序列数据集(日期是索引)。数据每15分钟测量一次(全年),结果是每天96个时间步。数据已规范化。这些变量是相关的。除VAR外的所有变量都是天气度量值。 VAR在一天期间和一周期间都是季节性的(因为它在周末看起来有点不同,但每个周末都不一样)。VAR值是固定的。我想预测未来两天(前192步)和未来七天(前672步)的VAR值。 以下是数据集的示例: 下面是我准备train

  • 我试图使用LSTM对多元数据进行时间序列预测。我有50000个15维的样品。我想用10的回顾。输入到LSTM层的形状是什么。会吗 或 我正在使用Keras。

  • 我试图使用Keras对多个变量进行同时预测。在这里使用这个例子,我想预测所有特征的值,包括pm 2.5,DEWP,TEMP等,而不仅仅是污染(pm 2.5)。本质上,这是,给定所有变量,建立一个模型来预测所有变量作为时间序列,而不仅仅是预测一个变量。 我使用重塑后的3D数据修改了原始示例代码,但出现了一个错误。代码如下: 输出为: 数据集在这里可用。 我的问题是: Keras LSTM层不是为此设

  • 我试图理解如何正确地将数据输入到我的keras模型中,以便使用LSTM神经网络将多变量时间序列数据分为三类。 我已经看了不同的资源——主要是杰森·布朗利的这三篇优秀的博客文章,其他的SO问题和不同的论文,但是没有一个信息完全符合我的问题案例,我也不知道我的问题是否数据预处理/将其输入模型是正确的,所以我想如果我在这里指定我的确切条件,我可能会得到一些帮助。 我试图对多元时间序列数据进行分类,其原始

  • 我是时间序列的新手,需要学科专家的帮助。所以我有一个有11个变量的实验室数据,报告了时间。10个变量是可控的,第11个变量是输出。我用LSTM预测了第11个变量的时间序列。结果比预期好得多。第11个变量预测为0.001 RMSE。训练数据有5000个样本,测试数据有4599个。我对预测很满意。现在我需要分析输入10个变量是如何影响第11个输出变量的。请建议一个好的库,类似问题的教程。