当前位置：首页 > 面试题库 >

将“ TimeStamp”列截断为pandas DataFrame中的小时精度

呼延河

2023-03-14

问题内容：

我有一个具有自动生成的索引的pandas.DataFrame被叫对象df，其中带有一列dt：

df['dt'].dtype, df['dt'][0]
# (dtype('<M8[ns]'), Timestamp('2014-10-01 10:02:45'))

我想做的是创建一个新的列，将其截断为小时精度。我目前正在使用：

df['dt2'] = df['dt'].apply(lambda L: datetime(L.year, L.month, L.day, L.hour))

这行得通，所以很好。但是，我想知道有一种使用pandas.tseries.offsets或创建DatetimeIndex或类似方法的好方法。

因此，如果可能的话，是否有一些pandas巫术来做到这一点？

问题答案：

在熊猫和0.18.0以后，有日期时间floor，ceil和round方法，以圆时间戳给定的固定精度/频率。要舍入到小时精度，可以使用：

>>> df['dt2'] = df['dt'].dt.floor('h')
>>> df
                      dt                     dt2
0    2014-10-01 10:02:45     2014-10-01 10:00:00
1    2014-10-01 13:08:17     2014-10-01 13:00:00
2    2014-10-01 17:39:24     2014-10-01 17:00:00

这是截断时间戳的另一种方法。与不同floor，它支持截断精度到年或月。

您可以临时调整基础NumPydatetime64数据类型的精度单位，将其从更改[ns]为[h]：

df['dt'].values.astype('<M8[h]')

这会将所有内容截断为小时精度。例如：

>>> df
                       dt
0     2014-10-01 10:02:45
1     2014-10-01 13:08:17
2     2014-10-01 17:39:24

>>> df['dt2'] = df['dt'].values.astype('<M8[h]')
>>> df
                      dt                     dt2
0    2014-10-01 10:02:45     2014-10-01 10:00:00
1    2014-10-01 13:08:17     2014-10-01 13:00:00
2    2014-10-01 17:39:24     2014-10-01 17:00:00

>>> df.dtypes
dt     datetime64[ns]
dt2    datetime64[ns]

相同的方法应该适用于任何其他单位：months 'M'，minutes'm'等：

保持一年： '<M8[Y]'
持续到一个月： '<M8[M]'
跟上一天： '<M8[D]'
保持最新： '<M8[m]'
跟上第二： '<M8[s]'

类似资料：

如何在Java中将双精度位截断为两位小数？

问题内容：例如，我有变量3.545555555，我希望将其截断为3.54。问题答案：如果您希望将其用于显示目的，请使用：如果需要进行计算，请使用：
在Python中截断为三个小数

问题内容：我如何获得1324343032.324？如您在下面看到的，以下内容不起作用：问题答案：如果要将其保存为，可以在其周围使用其他内容。
将列表截断为给定数量的元素

问题内容：有什么方法可以将列表截断（例如到前100个元素），然后丢弃其他列表（无需遍历单个元素）？问题答案：用途：您应该牢记返回项目的视图，因此，如果您希望列表的其余部分有资格进行垃圾回收，则应将想要的项目复制到新的项目：如果列表短于指定的大小，则应超出范围例外。选择所需大小的最小值和列表的当前大小作为结束索引。最后，请注意，第二个参数应比上一个所需的索引大一个。
将cassandra timestamp列转换为timeuuid

我从获取事件并存储到中。解析，其中包含字段，为表创建列，如下所示：在代码中：甚至尝试了:，也生成了相同的错误。如何通过spark作业将正确强制转换为并插入到中
如何在PostgreSQL中精确地保留前两位小数来截断双精度值？

当我使用PostgreSQL 11.8中的函数构建json时，我试图截断双精度值，但运气不好。更准确地说，我试图将19.98999999999984数字截断为两位小数，但要确保它不会四舍五入到20.00（它就是这样做的），而是保持在19.98。顺便说一句，我到目前为止尝试的是使用： 1），我得到值20.00 2）我得到值19.99- [42883]错误：函数舍入（双精度，整数）不存在下面是我使
是否为列截断数据？

在更改MySql列的数据类型以存储Twilio调用ID（34个字符字符串）后，我尝试使用以下命令手动更改该列中的数据：但是，我收到一个错误，看到列的数据类型被正确修改而没有意义？

相关阅读

截断（不舍入）SQL Server中的小数位列的数据被截断了吗？如何在Swift中将小数位截断到x个位置如何截断float64类型以达到特定精度？常量被截断为整数

相关文章

OrientDB截断记录 Oracle Timestamp类型 Java国际化(i18n)设置最小/最大精度哈啰 iOS 中台一面（面了将近2小时）判断栈的合法操作序列

相关问答

顶点列表中的边-小精灵python 将双精度转换为双精度，小数点后加一位？如何在Swift中截断小数到x位 Java和MySQL中枚举的数据截断（java.sql.SQLException：数据截断…）为什么在Linux的PDF中会截断文本？

相关工具

小说精品屋-微信小程序 SCEditor中文精简版深度截图 json2html 精简版截图快手

相关文档

2 小时精通金数据 Java 从小白到大牛精简版 JavaScript 编程精解中文第三版 Python 精要教程精通门罗币 XMR 简体中文版