当前位置: 首页 > 面试题库 >

将日期时间转换为另一种格式而不更改dtype

薛淳
2023-03-14
问题内容

我只是在自己学习熊猫,而遇到的问题很少。

  1. 在从csv文件读取的DataFrame中,我有一列包含日期数据,该日期数据具有不同的格式(例如'%m/%d/%Y''%Y-%m-%d',可能为空白。),并且我想统一此列的格式。但是我不知道是否还有其他格式。因此,当我使用时pd.to_datetime(),它会引发一些错误,例如格式不匹配以及数据不符合时间要求。如何统一此列的格式?

  2. 我已经将该列的一部分转换为datetime dtype,它的YYYY-mm-dd格式是。我可以保留datetime dtype并将其格式更改为'%m/%d/%Y'吗?我曾经用过pd.dt.strftime(),它将更改格式,但还将dtype更改为str,而不保留datetime dtype。


问题答案:

因此,当我使用pd.to_datetime()时,它引发了一些错误,例如格式不匹配以及数据不符合时间要求。如何统一此列的格式?

使用该errors='coerce'选项以返回NaT(非时间)未转换的值。另请注意,该format参数不是必需的。省略它可使熊猫尝试多种格式,否则它将恢复为NaT1。例如:

df['datetime'] = pd.to_datetime(df['datetime'], errors='coerce')

当心,混合类型可能会错误地解释。例如,Python如何知道05/06/20186月5日还是5月6日?将应用约定顺序,如果需要更大的控制权,则需要自己应用自定义顺序。

我可以保留datetime dtype并将格式更改为’%m /%d /%Y’吗?

你不能。datetime系列在内部存储为整数。任何人类可读的日期表示形式都只是一个 表示形式
,而不是基础整数。要访问自定义格式,可以使用Pandas中可用的方法。您甚至可以将这样的文本表示形式存储在pd.Series变量中:

formatted_dates = df['datetime'].dt.strftime('%m/%d/%Y')

dtypeformatted_dates将是object,这表明你的系列点到任意Python倍的元素。在这种情况下,那些任意类型碰巧都是字符串。

最后,我强烈建议您在工作流程的最后一步之前, 不要
datetime系列转换为字符串。这是因为,一旦这样做,您将不再能够在这样的系列上使用有效的矢量化运算。

1这将牺牲性能,并与进行对比datetime.strptime,后者
需要
指定格式。在内部,Pandas使用该dateutil库,如docs所示。



 类似资料:
  • 问题内容: 有没有一种简单的方法可以将一种日期格式转换为PHP中的另一种日期格式? 我有这个: 但是我当然希望它返回一个当前日期,而不是返回“黎明”。我究竟做错了什么? 问题答案: 第二个参数必须是正确的时间戳(自1970年1月1日以来的秒数)。您正在传递一个字符串,date()无法识别。 您可以使用 strtotime() 将日期字符串转换为时间戳。但是,即使strtotime()也无法识别格式

  • 问题内容: 我在MySQL中有专栏。 如何使用PHP 将其转换为 mm / dd / yy H:M(AM / PM)显示 ? 问题答案: 要将从MySQL检索的日期转换为请求的格式(): 请参考PHP日期格式选项以调整格式。

  • 我有一个输入日期作为字符串,格式为dd/MM/yyyy 现在我想把它转换成日期对象,格式为yyyy-MM-dd 目前我正在做 输入为:“2013年4月2日” 但我的约会对象是… 所需输出为:2013-02-04(不是字符串,而是日期对象)

  • 问题内容: 我正在寻找使用SQL将一种日期格式转换为另一种格式。我正在使用用于SQLite的数据库浏览器,日期存储在“ TEXT”类型的列中。 这是当前格式的2个示例: 2017/4/17上午9:09:09 2017/10/4下午10:21:13 请注意,在当前的日期,月份和小时格式中,如果只有一位数字,则当前不会以前导“ 0”填充。他们也把月份放在第一位,然后是日期,然后是年份。这两个示例应转换

  • 问题内容: 我从服务器获得的时间就像 。 我想将其转换为。 我还希望转换后的时间为24小时格式。任何人都可以解决这个问题。我想得到的输出就像 问题答案: 试试这个:

  • 我的输入值是'13/5/201412:00:00am',我需要将此格式更改为'2014-5-1300:00:00',但所有的datetime变量都是以dd-mm-yyyy格式返回的。我不想将日期转换为字符串,我希望将日期值存储在datetime属性中,并使用'yyyy-mm-dd'格式: