当前位置: 首页 > 面试题库 >

Python-pandas数据框线图在xaxis上显示日期

洪光霁
2023-03-14
问题内容

比较以下代码:

test = pd.DataFrame({'date':['20170527','20170526','20170525'],'ratio1':[1,0.98,0.97]})
test['date'] = pd.to_datetime(test['date'])
test = test.set_index('date')
ax = test.plot()

我最后添加DateFormatter

test = pd.DataFrame({'date':['20170527','20170526','20170525'],'ratio1':[1,0.98,0.97]})
test['date'] = pd.to_datetime(test['date'])
test = test.set_index('date')
ax = test.plot()
ax.xaxis.set_minor_formatter(dates.DateFormatter('%d\n\n%a')) ## Added this line

与第二张图的问题是,它开始于5-24代替5-25。另外,5-252017年的星期四不是星期一。是什么原因引起的?这个时区相关吗?(我也不明白为什么日期数字会彼此叠加)


问题答案:

通常,pandas和matplotlib的datetime实用程序不兼容。因此,matplotlib.dates在大多数情况下,尝试在使用熊猫创建的日期轴上使用对象会失败。

原因之一是例如从文档中看到的

datetime对象将转换为浮点数,该浮点数表示自0001-01-01 UTC以来的天数(加1)。例如,0001-01-01、06:00是1.25,而不是0.25。

但是,这不是唯一的区别,因此建议在日期时间对象中不要混合使用熊猫和matplotlib。

但是,可以选择告诉熊猫不要使用其自己的日期时间格式。在这种情况下,可以使用matplotlib.dates股票行情。这可以通过操纵。

df.plot(x_compat=True)

由于熊猫不提供复杂的日期格式化功能,因此可以使用matplotlib进行绘图和格式化。

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as dates

df = pd.DataFrame({'date':['20170527','20170526','20170525'],'ratio1':[1,0.98,0.97]})
df['date'] = pd.to_datetime(df['date'])

usePandas=True
#Either use pandas
if usePandas:
    df = df.set_index('date')
    df.plot(x_compat=True)
    plt.gca().xaxis.set_major_locator(dates.DayLocator())
    plt.gca().xaxis.set_major_formatter(dates.DateFormatter('%d\n\n%a'))
    plt.gca().invert_xaxis()
    plt.gcf().autofmt_xdate(rotation=0, ha="center")
# or use matplotlib
else:
    plt.plot(df["date"], df["ratio1"])
    plt.gca().xaxis.set_major_locator(dates.DayLocator())
    plt.gca().xaxis.set_major_formatter(dates.DateFormatter('%d\n\n%a'))
    plt.gca().invert_xaxis()

plt.show()


 类似资料:
  • 问题内容: 我有一个包含数百列的数据框,我需要查看所有列名称。 我做了什么: 输出为: 如何显示 所有 列,而不是截断的列表? 问题答案: 您可以全局设置打印选项。我认为这应该工作: 方法1: 方法2: 这样您就可以在执行操作时查看所有列名称和行。列名都不会被截断。 如果只想查看列名,可以执行以下操作:

  • 问题内容: 我想将稀疏矩阵(156060x11780)转换为数据帧,但出现内存错误,这是我的代码 我有一个问题 。我该如何解决? 问题答案: 尝试这个: 更新: 对于Pandas 0.20+,我们可以直接从稀疏数组构造:

  • 我有一个代码可以在折线图中显示数据,我需要将xAxis更改为日期,但日志有错误 下面是我的线图代码片段 下面是我的插入数据的代码片段 下面是我的值格式化程序的代码片段

  • 问题内容: 我有一个带有多个列以及一个日期列的数据框。日期格式为15年12月31日,我将其设置为日期时间对象。 我将datetime列设置为索引,并希望对数据框的每个月执行回归计算。 我相信实现此目的的方法是将数据框基于月份拆分为多个数据框,存储到数据框列表中,然后对列表中的每个数据框执行回归。 我使用过groupby可以按月成功拆分数据框,但是不确定如何正确地将groupby对象中的每个组转换为

  • 然而,在这一点上,我想做以下工作:1)将XAxis标签与垂直网格线匹配,使网格线也穿过蓝点;和 2) 在蓝色圆点上显示XAxis值。默认情况下,可以显示YAxis值-我知道怎么做;目前,我已经禁用了此功能,并且在下面的图片中没有显示,但如果我要显示启用它们,则它们将在5个蓝色点上显示为0.0、2.0、4.0、6.0和8.0。我想要的是显示XAxis值。 你能建议一个方法吗?非常感谢。

  • 问题内容: 如何设置熊猫数据帧的IPython html显示格式,以便 数字是正确的 数字以逗号作为千位分隔符 大花车没有小数位 据我所知,有设施,我可以这样做: 对于其他数据类型也是如此。 但是在以html显示数据框时,IPython不会选择这些格式选项。我仍然需要 但上面有1,2,3。 编辑: 以下是我针对2和3的解决方案(不确定这是最好的方法),但是我仍然需要弄清楚如何使数字列正确。 问题答