当前位置: 首页 > 文档资料 > Python 数据科学 >

Python Time Series

优质
小牛编辑
128浏览
2023-12-01

时间序列是一系列数据点,其中每个数据点与时间戳相关联。 一个简单的例子是股票市场中某一天的不同时间点的股票价格。 另一个例子是一年中不同月份的一个地区的降雨量。

在下面的例子中,我们将特定股票代码的每日股票价格的价值定为四分之一。 我们将这些值捕获为csv文件,然后使用pandas库将它们组织到数据框中。 然后,我们通过将附加的Valuedate列重新创建为索引并删除旧的值列来将日期字段设置为数据框的索引。

样本数据

以下是特定季度不同日期股票价格的样本数据。 数据保存在名为stock.csv的文件中

ValueDate	Price
01-01-2018,	1042.05
02-01-2018,	1033.55
03-01-2018,	1029.7
04-01-2018,	1021.3
05-01-2018,	1015.4
...
...
...
...
23-03-2018,	1161.3
26-03-2018,	1167.6
27-03-2018,	1155.25
28-03-2018,	1154

创建时间序列

from datetime import datetime
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('path_to_file/stock.csv')
df = pd.DataFrame(data, columns = ['ValueDate', 'Price'])
# Set the Date as Index
df['ValueDate'] = pd.to_datetime(df['ValueDate'])
df.index = df['ValueDate']
del df['ValueDate']
df.plot(figsize=(15, 6))
plt.show()

output如下 -

timeseries.png