当前位置：首页 > 面试题库 >

使用熊猫将每日数据重新采样到每月一次（日期格式）

司寇光华

2023-03-14

问题内容：

我正在尝试在Pandas
DataFrame中每天对一些数据进行重新采样。我是熊猫的新手，也许我需要先格式化日期和时间，然后才能执行此操作，但是我找不到关于如何使用导入的时间序列数据的正确方法的良好教程。我发现的一切都是自动从Yahoo或Quandl导入数据。

这是我的DataFrame中的内容：dataframe 段屏幕截图

这是我用来创建DataFrame的代码：

#Import excel file into a Pandas DataFrame
df = pd.read_excel(open('2016_forex_daily_returns.xlsx','rb'), sheetname='Sheet 1')

#Calculate the daily returns
df['daily_ret'] = df['Equity'].pct_change()

# Assume an average annual risk-free rate over the period of 5%
df['excess_daily_ret'] = df['daily_ret'] - 0.05/252

有人可以帮助我了解我需要对DataFrame中的“日期”和“时间”列进行什么操作以便重新采样吗？

问题答案：

DataFrame可以使用创建：

df = pd.read_excel('2016_forex_daily_returns.xlsx', sheetname='Sheet 1')
print (df)
        Date      Time  Equity
0 2016-01-03  22:16:22  300.38
1 2016-01-04  22:16:00  300.65
2 2016-01-05  14:26:02  301.65
3 2016-01-06  19:08:13  302.10
4 2016-01-07  18:39:00  302.55
5 2016-01-08  22:16:04  308.24
6 2016-01-11  02:49:39  306.69
7 2016-01-14  15:46:39  307.93
8 2016-01-19  15:56:31  308.18

我认为您可以先转换to_datetime列date，然后再使用resample一些聚合函数，例如sum或mean：

df.Date = pd.to_datetime(df.Date)
df1 = df.resample('M', on='Date').sum()
print (df1)
             Equity  excess_daily_ret
Date                                 
2016-01-31  2738.37          0.024252

df2 = df.resample('M', on='Date').mean()
print (df2)
                Equity  excess_daily_ret
Date                                    
2016-01-31  304.263333          0.003032

df3 = df.set_index('Date').resample('M').mean()
print (df3)
                Equity  excess_daily_ret
Date                                    
2016-01-31  304.263333          0.003032

类似资料：

每日数据，每3天重采样一次，有效计算5天后的数据

考虑我想计算一个尾随5天的总和，每3天。我期待着像这样的东西来自评论我想要一个解决方案，泛化处理一个指定频率的回顾，并抓住任何属于该回顾。对于上面的示例，回溯是，可能有4或50个观察结果属于回溯范围。
将大熊猫中的时间序列重新采样到每周间隔

问题内容：如何将大熊猫中的时间序列重新采样为每周从任意一天开始的每周频率？我看到有一个可选的关键字库，但它仅适用于少于一天的时间间隔。问题答案：您可以将锚定的偏移量传递给，以及它们涵盖此情况的其他选项。例如，星期一的每周频率：
每周更新一次的熊猫

问题内容：我每周有一些设备的日志数据。对于某些设备，它从星期一开始，对于某些设备，它在星期三开始，等等。有时此数据中有〜月的间隔，但是我希望DataFrame索引仍然包含每周具有NaN值的行。我正在尝试在Python中使用，但是我无法获得期望的结果。例：是）我有的：我期望/想要的（请注意带有NaN的2个新行）：我得到的是：因此，我获得了每个星期日的所有值和日期。但是我不需要每个星期天
格式化熊猫数据框索引日期

问题内容：我有一个从以下代码获得的数据框，但无法将索引转换为dd / mm / yyyy 这是结果我已经在stackoverflow上搜索了其他几个不同的变体，但是我找不到适合的组合。它仍然打印出as 问题答案：如果需要则是个问题，因为是in的默认显示格式。如果需要通过索引：不幸的是，这不起作用-docs：
用熊猫转换Excel样式日期

问题内容：我必须解析一个XML文件，该文件为我提供Excel样式的日期时间。例如：。熊猫是否提供将该数字转换为常规对象的方法？问题答案：好的，我认为最简单的方法是从浮点数构造a并将其添加到以下标量日期时间中：好的，似乎Excel的日期有点奇怪，谢谢@ayhan：
熊猫：使用groupby重新采样时间序列

问题内容：给定下面的熊猫DataFrame：我想对数据重新采样以每小时计数一次，同时按位置分组以生成如下所示的数据框：我尝试了resample（）和groupby（）的各种组合，但是没有运气。我将如何处理？问题答案：在我的原始帖子中，我建议使用。如今，使用代替。语法在很大程度上是相同的，但现在已不支持。此外，虽然只能按DatetimeIndex分组，但可以按日期时间列进行分组，而您可

相关阅读

熊猫：使用groupby重新采样时间序列使用日期维度的每月快照将缺失的日期添加到熊猫数据框熊猫每月滚动作业通过Python中的熊猫将每日库存数据转换为基于每周的数据

相关文章

C++ 每日阶梯挑战 Java日期格式化 Day 3. 每日一问 --- 工作中遇到的困难敏捷每日站立会议每日面试题复习——css

相关问答

使用管道将日期格式化为日/月/年如何将自定义函数应用到每一行的熊猫数据帧[重复]Jmeter-每次测试执行一次采样器日历-每周日期-Java 如何在数据库中选择每月的MAX日期

相关工具

每日金句活字格 - layUI日期选择插件熊猫Flash播放器一天日报美容新闻采集

相关文档

数据采集从入门到放弃每周一个 Python 3 模块中文版蓝天数据采集发布系统像 IDE 样使用 VIM 一个月纯 JS 挑战中文指南